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1. Zadania statystyki. Statystyka ma za zada- 
nie opis stanów rzeczy na podstawie wielkiej 
ilości danych. Na przykład ustalono pewnego razu w An- 
glii na podziałce przyrządu mierniczego położenie jednej 
z kresek pod mikroskopem. Pomiar powtórzono 40 razy i otrzy- 
mano następujące wyniki*) w dziesięciotysięcznych częściach 
yarda. 
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Albo przy oznaczaniu liczby kwiatów w szczytowych ko- 
szykach bławatka (Centaurea Cyanus) autor tej książki stwier- 
dził u 40 okazów wziętych na chybi trafi z pól w okolicach 
Zimnej Wody pod Lwowem następujące liczby kwiatów: 
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Takie dane mogą mieć zresztą charakter jakościowy, np. 
dotyczyć płci noworodków, barwy kwiatów itp. Jako przykład 


,!) Comptes Rendus. Tom 106, str. 784 (1888). 
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przytoczę dane co do płci 40 dzieci ochrzczonych w rzymsko- 
katolickiej parafii w Zimnej Wodzie w czasie od 3 września 
1916 do 12 maja 1918 roku: 


żżżżmżżmżmżżmmmmmmmż 


Ilość podobnych danych w ogromnej większości zagadnień 
jest nieograniczona — można przecież te same pomiary powta- 
rzać tyle razy, ile się tylko spodoba i zbierać bławatki bez 
końca z coraz to innych pól albo ze specjalnych kultur. Jest na 
ogół niemożliwością brać pod uwagę wszystkie możliwe dane. 
Wypada zadawalać się ich częścią, starając się zresztą o to, by 
mieć ich jaknajwięcej. Mówi się przeto w statystyce o pró- 
bach takiej czy innej populacji, rozumiejąc pod próbą 
zbiór danych w rodzaju przytoczonych czterdziestek a pod 
populacją ogół istniejącego lub możliwego do uzyskania mate- 
riału faktycznego. Nazwa populacji pochodzi stąd, że staty- 
styka zrodziła się z zagadnień społecznych i politycznych i do- 
tyczyła początkowo głównie ludności. Dla uniknięcia nieporo- 
zumień, warto jest zaznaczyć, że populacja nie jest zbiorem 
jakichś ciał ani zjawisk. tylko zbiorem liczb określających 
cechy ciał lub zjawisk albo zbiorem jakościowych określeń 
tych cech. 

Spotyka się zrzadka populacje ograniczone, naprzykład 
fakty dotyczące ludności danego kraju w danym czasie. W ta- 
kich przypadkach można operować całością populacji, co jednak 
w praktyce jest zwykle niewykonalne. Jeżeli chodzi na przy- 
kład o określenie wzrostu ludności, niepodobna wymierzyć go 
u wszystkich ludzi danego kraju. Trzeba zadowolić się próbą, 
dotyczącą najwyżej kilkudziesięciu tysięcy osobników, których 
się bierze zwykle wśród poborowych. 

Stwarza się w ten sposób konieczność sądzenia o popu- 
lacji według próby, o całości na podstawie przypadkowej 
części jej, która przy nieograniczonym zakresie populacji jest 
znikomo mała, a nawet przy ograniczonym zakresie nigdy nie 
stanowi poważniejszej jej części. Charakter próby zależy 
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zawsze w pewnej mierze od przypadku. Pociąga to za sobą 
szerokie zastosowanie nauki o prawdopodobieństwie w staty- 
styce. Zato też próby muszą mieć naprawdę 
przypadkowy charakter. Wszelkie dobieranie 
ich, nieświadome czy rozmyślne, prowadzi 
zawsze do fałszywych wniosków. 

Trzeba jeszcze do tych ogólnych uwag o statystyce dodać 
wyjaśnienie wartości jej wyników. Pod tym względem zacho- 
dzą nieraz nieporozumienia. Chodzi o to, że wyniki badań 
statystycznych charakteryzują populacje, 
opisują je, ale nie dają nic ponadto. Szczególnie 
ciekawe nieporozumienie zachodzi pod tym względem odnośnie 
do dokładności pomiarów. Przyjmuje się powszechnie, że śred- 
nia arytmetyczna obliczona z wyników pomiarów zbliża się 
nieograniczenie do mierzonej wielkości w miarę zwiększenia 
ilości pomiarów. Otóż tak nie jest. Średnia obliczana z co- 
raz liczniejszych pomiarów zbliża się istotnie do prawdziwej 
średniej charakteryzującej populację złożoną z wyników po- 
miarów wykonanych i niewykonanych, ale możliwych do wy- 
konania. Nie wynika jednak z tego bynajmniej, by średnia 
tej populacji była identyczna z mierzoną wielkością. Jest to 
założenie niczem nieuzasadnione. Prawdziwa wartość mierzo- 
nej wielkości nie może być tą drogą ustalona i zdaje się nie 
da wogóle ustalić. Na ten temat prowadzili dyskusje ludzie tej 
miary co Laplace i Gauss ale bezskutecznie. Ciekawe 
uwagi w tej kwestii znajdzie czytelnik w rozprawie szwedz-, 
kiego astronoma Charliera pt. „Ueber das Fehlergesetz” 
(Meddelanden fran Lunds Astronomiska Observatorium N 24). 
Obszernie referuje odnośne dyskusje Czuber w książce pt. 
„Theorie der Beobachtungsfehler” (Lipsk 1891), w której jest 
podana źródłowa literatura. 

W końcu trzeba omówić podział zajmującej nas nauki. 
Można w niej wyróżnić dwa działy. Jeden zajmuje się pojedyń- 
czą populacją. Przedmiotem drugiego są związki zachodzące 
między populacjami, na przykład związek między wzrostem 
synów a wzrostem ojców, związek między barwą włosów a bar- 
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wą oczu. Związki te są ujmowane jako zależności funkcjonalne, 
nie przyczynowe. Dlatego też z dwóch populacji, pozostają- 
eych ze sobą w związku, uważa się bez różnicy jedną lub drugą 
za zmienną niezależną. Na przykład, jak chodzi o. związek mię- 
dzy wzrostem synów a wzrostem ojców, rozpatruje się równo- 
cześnie zależność wzrostu synów od wzrostu ojców i zależność 
wzrostu ojców od wzrostu synów, jakkolwiek z pewnością 
w tym drugim przypadku nie zachodzi związek przyczynowy. 
Mówi się przeto w statystyce nie o zależności, lecz o współ- 
zależności między populacjami. W tym zagadnieniu sta- 
tystycznym, tak samo jak we wszystkich innych, chodzi tylka 
o opis. 

2. Materiały statystyczne. Mogą one mieć treść bardzo różną. 
Początkowo stosowano metody statystyczne tylko do zagadnień 
społecznych i politycznych (skład ludności, rozdział majątku, 
podatki itp.). Sama nazwa statystyki stąd pochodzi. Wywodzi 
się ona z łacińskiego wyrazu status, któremu w średniowie- 
czu nadano sens równoznaczny z wyrazem państwo — stąd 
w języku angielskim państwo oznacza się wyrazem state, 
w niemieckim przez Staat, we francuskim przez ćtat. 
Statystą dawniej nazywano męża stanu, co np. można 
widzieć w tekście ,„„ Hamleta” pochodzącym z roku 1602. Pierw- 
szym, który użył wyrazu „statystyka” w obecnym jego zna- 
czeniu, miał być Gotfryd Achenwall, profesor nauk 
politycznych w Getyndze, autor dzieła „Abriss der Staats- 
wissenschaft der europäischen Reiche” (1749). Nie jest to 
pewne, niektórzy autorowie twierdzą, że nazwa ta była przed 
Achenwallem używana przez Schmeitzela/). 

Następnie już w wieku XIX., za inicjatywą Belga Jakóba 
Queteleta (1796—1874) i zwłaszcza Anglików Fran- 
ciszka Galtona (1822—1911) i Karola Pearsona 
(1857—1936) wprowadzono metody statystyczne w szerokiej 
mierze do nauk biologicznych. Wyrazem tej pracy angielskich 
badaczy jest czasopismo . „Biometrika”, wychodzące od ro- 


1) Zob. Andrć.Liesse. La statistique. 5 wyd. Paryż 1933, str. 2. 
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ku 1902. Biometrią nazwano statystykę biologiczną. Jed- 
nocześnie metody statystyczne zastosowano w szerokiej mierze 
do zagadnień kinetycznej teorii materii i nawet do zagadnień 
dotyczących gwiazd stałych, nie licząc zastosowania tych me- 
tod do określenia błędów obserwacyjnych. 

Te różnice w treści materiałów mają jednak małe znacze- 
nie, — stosuje się w nich zawsże te same metody. Na przy- 
kład zagadnienie ilości płatków w kwiatach jaskrowatych jest 
opracowywane tą samą metodą, co częstość wypadków śmierci 
w armii od kopnięcia konia (zob. ust. 37). Natomiast poważne 
znaczenie mają różnice w jednolitości mate- 
riałów. 

Można wogóle postawić na czele metodyki statystycznej 
wymaganie, by materiał był jednolity. Nie należy tego rozu- 
mieć dosłownie, bo w przyrodzie niema dwóch rzeczy i zdarzeń 
w zupełności do siebie podobnych. Nie tylko organizmy tej 
samej rasy nie są jednakowe, ale prawdopodobnie nawet atomy 
tego samego pierwiastka i zawarte w nich elektrony. A co do- 
piero mówić o zdarzeniach, jak pomiary, obserwacje i stany 
pogody. Chodzi tu o jednolitość względną. Trzeba natomiast 
zdawać sobie sprawę z jej stopnia, który zresztą może być 
różny, zależnie od charakteru zagadnień. 

Uchybienia zasadzie jednolitości mogą doprowadzić do naj- 
bardziej niedorzecznych wniosków. Na przykład w okresie czasu 
około roku 1938 pewien odłam prasy francuskiej podniósł alarm 
z powodu rzekomo wielkiej przestępczości wśród cudzoziemców 
mieszkających we Francji, m.i. wśród Polaków. Wniosek ten 
był oparty na stosunku liczby więźniów danej narodowości do 
jej ogólnej liczebności we Francji. Okazało się jednak, że wielu 
cudzoziemców przebywa w więzieniu za przewinienia, których 
Francuz we Francji popełnić nie może, a mianowicie za nie- 
legalny pobyt na francuskim terytorium. Po odrzuceniu tych 
przypadków, które nie mają nic wspólnego z przestępczością, 
okazało się, że stosunkowa liczba więźniów cudzoziemców nie- 
wiele się różni od odnośnej liczby więźniów Francuzów i o wy- 


jątkowej przestępczości wśród cudzoziemców we Francji nie 
może być mowy. 

. Zasada jednolitości materiału statystycznego nie pozwala 
m. i. na łączenie w jedną populację wyników obserwacyj Wy- 
konanych przez różne osoby, gdyż każdy człowiek ma swoiste 
skłonności do popełniania błędów. Nie pozwala ona traktować 
iącznie dochodowość inwestycji w różnych częściach kraju 
z uwagi na różne warunki ekonomiczne. Nie pozwala na do- 
kładniejsze porównanie obserwacyj meteorologicznych wyko- 
nanych w różnych miejscach, jeżeli pochodzą one. z różnych 
okresów itd. 

Największe bodaj znaczenie posiada omawiana zasada dla 
nauk biologicznych, a to z powodu istnienia w obrębie nieomal 
każdego gatunku, rozumianego w zwykłym tego słowa znacze- 
nia, licznych nieraz gatunków elementarnych, zwanych od- 
mianami, rasami, czystymi liniami itp. Są one nieraz do siebie 
bardzo podobne i różnią się tylko cechami ilościowymi. Ma- 
teriał wtedy wydaje się jednolitym, co w istocie nie ma miejsca 
Taki przypadek zachodzi np. u fasoli. Stwierdził to Johann- 
sen ') mierząc i ważąc osobno nasiona pochodzące od różnych 
jej osobników. Wynik tych pomiarów był następujący: można 
osobniki tej rośliny podzielić na grupy takie, że w obrębie 
każdej grupy Średnia waga i wymiary nasion będą jednakowe, 
natomiast różne w różnych grupach. Te średnie wartości utrzy- 
mują się bez zmiany w dalszych pokoleniach, wobec czego 
każda taka grupa stanowi odrębny elementarny gatunek, na- 
zwany przez Johannsena czystą linią. Pomieszane ze 
sobą osobniki różnych czystych linij fasoli nie dają się roz- 
poznać przez ważenie i pomiary nasion, bo odnośne wielkości 
wykazują odchylenia od średniej tego samego rzędu wielkości 
co różnica między średnimi, charakteryzującymi dane linie. 
Naprzykład czysta linia B ma średnią wagę nasion 520 mg. zaś 
linia O — 310 mg, ale jednocześnie w obu tych liniach są na- 
siona o wadze 250—520 mg. 


ni 3} W. w ohannsen. Ueber Erblichkeit in Populationen und in 
reinen Linien — Jena (1903). 


U 'fasoli wyróżnienie gatunków elementarnych było sto- 
sunkowo łatwe, gdyż można było otrzymać bez trudu potom- 
stwo każdego osobnika oddzielnie bez udziału innych osobni- 
ków, a to skutkiem samozapylenia właściwego tej roślinie. 
Gorzej jest, jeżeli roślina rozmnaża się przez krzyżowanie, jako 
to zwykle bywa. Wtedy para osobników, biorąca udział w roz- 
mnażaniu, może należeć do różnych gatunków elementarnych 
Skutkiem tego gatunek będzie mieszaniną nie tylko gatunków 
elementarnych, ale jeszcze i mieszańców między nimi. Otrzy- 
manie jednolitego materiału statystycznego staje się ao da- 
leko trudniejsze. 

Materiał biologiczny może być niejednolity jeszcze z inne- 
go powodu. W różnych warunkach bytowania ilościowe cechy 
organizmów zwykle wykształcają się różnie, na przykład wzrost 
ludzi wyraźnie maleje przy niedostatecznym odżywianiu. Naj- 
silniejsze zmiany tego rodzaju wykazują rośliny. Szczególnie 
jaskrawym przykładem jest mak, którego liczne znamiona są 
nieraz przedmiotem rozważań statystycznych. Jest ich naj- 
częściej 13, ale to tylko w dobrych warunkach wegetacji. Nie- 
korzystne warunki pomniejszają ich ilość i to tak dalece, że 
w krańcowych wypadkach tworzą się kwiaty z dwoma tylko 
znamionami. Jeżeli zatem chcemy stwierdzić, jaki jest wymiar 
cechy właściwy danemu gatunkowi, trzeba brać osobniki, które 
wyrosły w jednakowych warunkach otoczenia. Otrzymany wy- 
nik będzie przytem ważny tylko dla danych warunków. Nato- 
miast materiał pochodzący z różnego otoczenia nie będzie jed- 
nojity i da wyniki chwiejne. 

Jeżeli chodzi o ustalenie cech gatunkowych metodami 
statystycznymi, trzeba następnie mieć na uwadze, że każda 
liczba w odnośnym materiale powinna odnosić się do innego 
osobnika. Jest to szczególnie ważne przy badaniu roślin, u któ- 
rych widzi się często narządy pozornie jednakowe, np. kwiaty. 
Dla uproszczenia pracy badacze są skłonni traktować równo- 
rzędnie cechy takich narządów bez względu na ich przyna- 
leżność do tych czy innych osobników. Na przykład przy zli- 
czaniach znamion w kwiatach maku brano wszystkie kwiaty. 


Tymczasem kwiaty wykazują wyraźne różnice zależnie od po- 
łożenia ich na roślinie. I tak autor tej książki otrzymał dla 
liczby znamion maku następujące średnie u 100 osobników 
wziętych z pewnej kultury Ogrodu Botanicznego w Dublanach: 


kwiaty szczytowe 12.80 
kwiaty górnej gałęzi 12.14 
kwiaty drugiej gałęzi 12.61 
kwiaty trzeciej gałęzi 13.05 


Zatem gdyby się wzięło wszystkie kwiaty maku bez względu 
na ich położenie na roślinie, miałoby się materiał niejednolity. 
Trzeba brać tylko kwiaty szczytowe albo z pewnej określonej 
gałęzi, po jednemu z każdego osobnika. 

Na tym jeszcze nie koniec. Oddzielne rośliny, które się 
widzi w przyrodzie albo w kulturach, nie zawsze stanowią od- 
rębne osobniki — mogą one być odrębnie żyjącymi częściami 
tego samego osobnika. Nie dotyczy to maku, który jest jedno- 
roczną rośliną. Każdy jego okaz wyrasta z osobnego nasienia 
i jest odrębnym osobnikiem. Jeżeli jednak weźmiemy trwałe 
rośliny rozmnażające się wegetatywnie, jak poziomki albo 
ziemniaki, możemy mieć mnóstwo pozornie odrębnych roślin, 
będących tylko częściami tego samego osobnika — całe pole 
ziemniaków może stanowić jeden osobnik! Takie pozornie od- 
rębne osobniki noszą nazwę klonów. Otóż różnice między 
klonami, pochodzącymi od tego samego osobnika, są znacznie 
mniejsze niż między naprawdę odrębnymi osobnikami. Przeto 
zaliczanie do tej samej populacji cech klonów, pochodzących 
od różnych osobników, da materiał niejednolity. W dziedzinie 
zoologii ma się takie trudności tylko u niższych zwierząt. 

3. Metody statystyki. Mnogość materiału, którym operuje 
statystyka, powoduje to, że musi ona posługiwać się liczbami 
nawet wtedy, kiedy materiał opracowywany ma charakter ja- 
kościowy. W tym ostatnim przypadku ustala się ilość danych 
dla tej lub innej cechy. Na przykład w trzecim przykładzie 
ust. 1 mamy 18 chłopców i 22 dziewczyny. Z konieczności tedy 
metody statystyki maja charakter matema- 
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tyczny. Statystyka jednak nie jèst działem 
matematyki. 

Jest to kwestia zasadnicza nie tylko dla statystyki, lecz dla 
wszystkich nauk zajmujących się badaniem rzeczywistości, czy 
to w dziedzinie przyrody, czy w zakresie nauk społecznych 
Zachodzi bowiem zasadnicza różnica między wspomnianymi 
naukami, które można nazwać realistycznymi”, a naukami 
matematycznymi. Mianowicie, podczas gdy w matematyce 
założenia mogą być dowolne, w naukach reali- 
stycznych muszą one wytrzymać próbę spraw- 
dzania. Sprawdzanie polega na porównywaniu wniosków 
wyprowadzonych z założeń z obserwowanymi faktami. Wyma- 
gana jest zgodność jednych z drugimi, podczas gdy w matema- 
tyce wystarcza logiczna konsekwencja przy wyprowadzaniu 
wniosków. 

W stosowaniu metod matematycznych do zagadnień staty- 
stycznych spotykamy się z niemałą trudnością, wynikającą 
z charakteru danych statystycznych. Mianowicie liczby 
materiałów, którymi operuje statystyka są 
zawsze całkowite. Jest to oczywiste w przypadkach, 
kiedy materiał otrzymuje się przez zliczanie — kwiatów 
w kwiatostanach, chłopców wśród dzieci itp. Mniej oczywiste 
są przypadki, w których dokonuje się pomiarów. Ma się wtedy 
liczby pozornie ułamkowe, jak te, które zostały przytoczone 
w pierwszym przykładzie ust. 1. Są to jednak ułamki z tym 
samym mianownikiem, a więc właściwie liczby całkowite, po- 
dające ilość jednostek miary użytej przy pomiarach. We 
wspomnianym przykładzie taką jednostką jest milionowa 
część yarda. Dopiero opracowanie materiałów daje liczby na- 
prawdę ułamkowe, kiedy się oblicza z różną dokładnością 
średnie arytmetyczne, prawdopodobieństwa błędów i inne wiel- 
kości charakteryzujące populacje. 

Niema przeto ciągłości w materiałach statystycznych, pod- 
czas gdy matematyka operuje przeważnie zmiennymi ciągłymi. 
Ten brak ciągłości jest spowodowany w pewnej mierze szero- 
kim rozpowszechnieniem nieciągłości w przyrodzie. daleko 


szerszym niż się to wydaje na pierwszy rzut oka. Pozornie 
ciągła materia okazała się zbiorem odrębnych cząsteczek — 
drobin, drobiny — zbiorem atomów, atomy — zbiorem pro- 
tonów, neutronów i elektronów. Ostatnio „„zatomizowano” na- 
wet energię, przynajmniej promienistą, na kwanty i fotony. 
Skutkiem tego „atomizowania” przyrody pomiary coraz częściej 
są zastępowane przez zliczania. Naprzykład dla charakterystyki 
pierwiastków chemicznych używa się obecnie numerów zamiast 
ciężarów atomowych. Te numery są to liczby elementarnych 
dodatnich ładunków w jądrach atomowych. I tak wodór, ze 
swoim ciężarem atomowym 1.008, jest określany jako pierwia- 
"stek numer pierwszy i to wraz ze swoimi dwoma odmia- 
nami (izotopami), z którym jeden ma atomy dwa.razy, a drugi 
trzy razy cięższe. Chlor, posiadający ciężar atomowy 34.45, stał 
się ze swoimi dwoma izotopami o ciężarach atomowych 35 i 37 
pierwiastkiem numer siedemnasty itd. Trzeba przy tym 
jednak mieć na uwadze, że gdyby nawet ciągłość panowała 
w przyrodzie, to nieuniknione użycie jednostek w pomiarach 
spowodowałoby zawsze rozbicie jej na wielokrotności użytych 
jednostek. 

Matematyczne metody statystyki są bardzo zawiłe i wy- 
magają dobrej znajomości rachunku nieskończonościowego i na- 
uki o prawdopodobieństwie. Chcąc umożliwić korzystanie z tej 
książki możliwie szerokim kołom czytelników, nie będę mógł 
podać pełnego uzasadnienia omawianych metod. Natomiast 
będę się starał na przykładach z możliwie -różnych dziedzin 
wyjaśnić ich znaczenie dla należytego zobrazowania rzeczy- 
wistości. 

Opracowanie metod statystycznych jest głównie zasługą 
angielskich badaczy, w szczególności Pearsona, Fishera 
orąz Gosseta, który niewiadomo dlaczego ukrywał się pod 
pseudonimem Studenta. Następnie dużo wnieśli do tej 
dziedziny pracy naukowej .Skandynawowie, zwłaszcza szwedzki 
astronom Charlier, oraz Rosjanie: Czebyszew, Czu- 
prow. Poważny jest udział polski, zwłaszcza dzięki pracom 
Ś.p. PO ASIPZAWA Bortkiewicza. 


Co się tyczy nauki o prawdopodobieństwie, która odgrywa 
wielką rolę w metodach statystycznych, to dzieje jej sięgają 
bardziej odległych czasów niż dzieje statystyki, czasów Bła- 
żeja Pascala (1623—1662) i Jakóba Bernoulliego 
(1654—1705). 

W formie współczesnej została ona ugruntowana przez 
Laplace'a (1749—-1827) w dziele pt. „Thćorie analytique 
des probabilités” ogłoszonym w ostatecznej formie jako 3 wy- 
danie w r. 1820. Paryska Akademia Nauk wydała je ponownie 
w roku 1886: ` 


4. Literatura i pomoce. W języku polskim mamy trzy pod- 
ręczniki statystyki. Dwa są oryginalne: J. Czekanow- 
skiego „Zarys metod statystycznych w zastosowaniu do an- 
tropologii” (Warszawa 1913) oraz S. Moszczefńiskiego 
„Metody statystyczne w zastosowaniu do organizacji gospo- 
darstw rolniczych, ogrodniczych i leśnych” (Warszawa 1924). 
Obie te książki; mimo swojego specjalnego zadania, v dają akt 


przegląd metod statystyki. 

Trzecim podręcznikiem w języku polskim jest tłumaczenie 
książki angielskiego badacza Y ule'a „Wstęp do teorii staty- 
styki” (Warszawa 1921). Jest pisany przystępnie, ale nieco 
zawile. 

Pożyteczne są wreszcie artykuły A. Łomnickiego, 
drukowane w „Kosmosie, Seria B” z lat 1928 i 1930 pt. „Za- 
gadnienia statystyki matematycznej”. 

W literaturze obcojęzycznej najbardziej przystępny wykład 
metod statystycznych znajdzie czytelnik w książce duńskiego 
botanika W. Johannsena „Elemente der exacten Erblich- 
keitslehre” (Jena 3 wyd. 1926). 

Bardzo cenne są dalej dwa przystępnie pisane podręczniki. 
Jeden C. V. L. Charliera „Vorlesungen über die Grundzüge 
der matematischen Statistik” (Lund 1920). Drugi rosyjski B. U. 
Romanowskiego „Elementarnyj kurs matematiczeskoj 
statistiki” (Moskwa — -Leningrad 1939). 

Wymienione powyżej książki nie wymagają znajomości ra- 
chunku nieskończonościowego. Dla czytelników mających na- 


leżyte przygotowanie matematyczne można polecić dwa pod- 
ręczniki. Szczególnie cenna jest książka szwedzkiego statystyka 
OskaraN.Andersona „Einführung in die mathematische 
Statistik” (Wiedeń 1935). Pisana jest z werwą i humorem, co 
kontrastuje osobliwie z wielkim aparatem matematycznym. 
Z konieczności trudna w czytaniu, przedstawia jasno omawiane 
zagadnienia. Autor sprzeciwia się stanowczo traktowaniu staty- 
styki, nawet tzw. matematycznej, jako działu matematyki, co 
znalazło swój wyraz na wstępie w podaniu motta z dzieł C z u- 
prowa: „Statistik spielende Mathematiker können nur durch ` 
mathematisch ausgerüstete Statistiker überwunden werden”. 
Ciekawa jest osoba Andersona — Szwed podający się za 
za ucznia Rosjanina Czu prowa i Polaka Bortkiewicza, 
uwzględniający skrupulatnie dorobek polski, podający tytuły 
prac polskich z dokładną pisownią, zatrudniony w Sofji jako 
dyrektor Instytutu Statystycznego do badań gospodarczych na 
Uniwersytecie. 

Nie mniej cenna jest książka R. A. Fishera, najwy- 
bitniejszego obecnie angielskiego statystyka, pt. „Statistical 
methods for research workers” (Edymburg — Londyn, 6 wyd. 
1936). Niestety, pisana stylem telegraficznym, jest zbiorem ła- 
migłówek, pomimo licznych przykładów. 

Źródłowa literatura teoretycznej statystyki jest silnie roz- 
proszona. Są jednak dwa czasopisma specjalnie jej poświęcone: 
wspomniana powyżej w ust. 2 angielska „Biometrika” oraz 
międzynarodowe czasopismo „Metron? wychodzące we Wło- 
szech. 

Co się tyczy nauki o prawdopodobieństwie, mamy w języku 
polskim jeden tylko podręcznik W. Gosiewskiego: „Za- 
sady rachunku prawdopodobieństwa” (Warszawa 1906). Z licz- 
nych książek w obcych językach można polecić poza podstawo- 
wym dziełem Laplace'a zbiorowe dzieło wychodzące pod 
redakcją Emila Borela od r. 1925 pt. „Traité de calcul des 
probabilités”. Teoria statystyki jest nim objęta również. 

Do wykonania rachunków bardzo pożyteczne są maszyny 
do rachowania (arytmometry). Między innymi bardzo wygodna 


jest szwedzka maszyna systemu Odhner. Niemiecka B run- 
sviga jest nieznaczną odmianą tej szwedzkiej maszyny o nieco 
gorszym wykonaniu. Niestety, te maszyny są drogie i nie każ- 
demu dostępne. 

Można jednak i bez nich prowadzić badania statystyczne. 
Trzeba w tym celu zaopatrzyć się w tabele iloczynów, np. „Re- 
chentafeln' Zimmermanna (Berlin 1918), które dają ilo- 
czyny liczb trzycyfrowych przez dwucyfrowe i w znacznej mie- 
rze zastępują maszynę do rachowania, o ile chodzi o mnożenie. 
Dają one także kwadraty, sześciany i pierwiastki kwadratowe 
liczb trzycyfrowych. Jeżeli jednak chodzi o dodawanie i odej- 
mowanie, nic nie może zastąpić maszyny do rachowania. 
W braku jej trzeba uzbroić się w cierpliwość i z rezygnacją 
przyjąć nieuniknioną stratę czasu. i 

Tablice logarytmiczne są oczywiście niezbędne, ale te mo- 
żna zawsze mieć. Wystarczą 5-cyfrowe. 


CZĘŚĆ PIERWSZA 
STATYSTYKA POJEDYNCZYCH POPULACJI 


ROZDZIAŁ I. 
SZEREGI ROZDZIELCZE 


5. Układanie szeregu rozdzielczego, Pierwszym krokiem 
w opracowaniu każdego jako tako licznego materiału statystycz- 
nego, mającego postać zobrazowaną przykładami ust. 1, jest 
ułożenie szeregu rozdzielczego. Poszczególne dane 
w takim materiale noszą nazwę wariantów. Takie warianty 
są częściowo jednakowe, częściowo różne. Trzebapoliczyć 
ile razy powtarza się każdy rodzaj wariantów 
i zestawić ich częstości. Takie zestawienie 
nazywa się szeregiem rozdzielczym. 

Najprościej przedstawia się omawiane zadanie, jeżeli ma- 
teriał statystyczny składa się z danych jakościowych. Ma się 
wtedy do czynienia z niewielką ilością rodzajów wariantów 
I tak w trzecim przykładzie ust. 1 mamy tylko chłopców 
i dziewczynki, pierwszych jest 18, drugich 22. Bardziej zawiłe 
jest to zadanie w przypadkach materiału ilościowego — jest 
wtedy więcej różnych wariantów. A więc w przykładzie 2 
ustępu 1 mamy dla liczby kwiatów w szczytowych koszykach 
bławatka 15 różnych wartości od 25—41. Napiszmy w jednym 
wierszu te liczby we wzrastającym porządku ich wielkości, nie 
pomijając tych, które nie są wcale reprezentowane. Pod nimi 
umieścimy ich częstości, przyczem częstość nieobecnych war- 
tości oznaczymy przez zero. 
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Ułożyliśmy w ten sposób szereg rozdzielczy dla danego ma- 
teriału. 


Wartości wariantów w takim szeregu można uważać za 
wartości pewnego rodzaju zmiennej niezależnej, tzw. zmien- 
nej ewentualnej. Różni się ona od zmiennych niezależ- 
nych rozpatrywanych w matematyce tym, że przybiera tylko 
wartości całkowite, a więc jest nieciągła. Odnośne częstości mo- 
żemy uważać za pewnego rodzaju funkcje takiej zmiennej nie- 
zależnej. Będą one zawsze dodatnie i całkowite albo równe zeru, 
zatem ta funkcja będzie się odznaczała również brakiem cią- 
głości. 

Forma otrzymanego szeregu (1) jest prowizoryczna i w dal- 
szym ciągu trzeba będzie ją ulepszyć, ale już teraz uzyskujemy 
pewne informacje o badanej populacji. Przede wszystkim wi- 
dzimy, w jakich granicach są zawarte liczbowe wartości wa- 
riantów, inaczej mówiąc określamy zakres zmienności 
wariantów. Następnie stwierdzamy, że pośrednie wartości wa- 
riantów wystąpiły na ogół w większej ilości, są częstsze, nato- 
miast krańcowe — zarówno najmniejsze jak i największe — są 
w mniejszej ilości, są rzadsze. 


Rzucającą się w oczy wadą rozpatrywanej formy szeregu 
są gwałtowne przeskoki w ciągu częstości, spowodowane przez 
przypadkowość próby, np. 34 występuje raz jeden, podczas gdy 
sąsiednie wartości wariantów — 33 i 35— 7 i 5 razy. Tak jest 
zawsze, kiedy wielkość próby jest mała w porównaniu z wiel- 
kością wariantów. Lepiej to wypada, jeżeli warianty są mniej- 
sze. Naprzykład jeżeli weźmiemy liczbę płatków u przylaszczki 
(Anemone Hepatica), która to liczba waha się w granicach od 
6 do 11, to próba tej wielkości, jaka była wzięta u bławatka, 
już może dać szereg wyrównany. 1 tak naprzykład próba: 


Zwiększenie próby wyrównuje stopniowo omawiane nie- 
prawidłowości szeregu rozdzielczego. 'Trzeba jednak dużego 
materiału, by osiągnąć ten cel bodaj w części, jeżeli wartości 
wariantów są znaczne. Na przykład jeżeli do czterdziestkowej 
próby bławatka dodamy 260 wariantów z tego samego mate- 
riału. by mieć próbę z 300, otrzymamy szereg następujący: 
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W nowej formie szereg wykazuje w środkowej części 
mniejsze przeskoki. Zupełne ich usunięcie jest niemożliwe na- 
wet w wielotysięcznych próbach — prawie zawsze zostają one, 
co prawda tylko na końcach szeregu. 

Przytoczony powyżej większy materiał wykazuje rozsze- 
rzenie zakresu zmienności — wartości wariantów są teraz 
w granicach od 21—62, zamiast 25 i 41. Dalsze powiększenie 
próby dałoby prawdopodobnie dalsze rozszerzenie, zresztą tylko 
do pewnej granicy. Widzimy zatem, że zakres zmienno- 


ści zależy nietylko od materiału, lecz od 
wielkości próby. 


PRZEDMOWA. 


Sprawa rozpowszechnienia, a zwłaszcza pogłębienia znajo- 
mości metod statystyki matematycznej jest obecnie bardzo aktu- 
alnym zagadnieniem nauki polskiej. Dotychczas nie posiadamy 
bowiem w kraju ośrodka gromadzącego teoretyków-specjalistów 
pracujących twórczo w tym dziale wiedzy, jakkolwiek w dzie- 
dzinie jej zastosowań praktycznych możemy się wykażać po- 
ważnym dorobkiem. Metody statystyki matematycznej zdobyły 
sobie bowiem u nas prawa obywatelstwa nie tylko w różnych 
działach nauk biologicznych, a przede wszystkiem w antropolo- 
gii, lecz sięgnęły też i do dziedziny nauk humanistycznych. Za- 
równo w etnologii jak i w językoznastwie, inicjatywa wyszła 
przy tym ze strony nauki polskiej, rozwijającej i unowocześnia- 
jącej prawie zupełnie zapomniane poczynania znakomitego 
angielskiego etnologa E. B. TYLOR:'a. 

Ześrodkowanie się na zastosowaniach angielskiej statystyki 
matematycznej i na oryginalnym rozwinięciu aparatu indukcyj- 
nego umożliwiło stworzenie polskiej szkoły antropologicznej, 
przeciwstawiającej się angielskiemu kierunkowi biometryczne- 
mu swoimi mendelistycznymi założeniami, i pozwoliło na ilościo- 
we uzasadnienie polskiej syntezy slawistycznej. Ponadto prze- 
niesienie tych osiągnięć metodologicznych do dziedziny botani- 
ki, stworzyło podstawy obiektywnego ustosunkowania się do 
zagadnień fitosocjologii, a w dziedzinie językoznastwa umożli- 
wiło nawet uporanie się z zagadnieniem systematyki języków 
australijskich. 

Mimo tak poważnych osiągnięć zastosowań nowoczesnej 
statystyki matematycznej w różnych dziedzinach wiedzy w bie- 
żącym stuleciu i przy posiadaniu tak wybitnego teoretyka, ja- 
kim w poprzedniej generacji był śp. Władysław BORTKIEWICZ, 
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a obecnie jest Jerzy Spława-NEYMAN, profesor Uniwersytetu 
Berkeley w Kalifornii, nie posiadamy dotychczas uniwersytec- 
kiego kompendium tej dziedziny wiedzy. 

Śp. Dezydery SZYMKIEWICZ był tak wyjątkowym biolo- 
giem, że posiadane wykształcenie matematyczne pozwalało mu 
na podjęcie trudu opracowania tego rodzaju podręcznika, jednak 
był on tak przeciążony. swoimi zajęciami zawodowymi, że spra- 
wa poszła w odwłokę. Dopiero częściowa przymusowa bezczyn- 
ność spowodowana przez wypadki wojenne i w tej dziedzinie 
zaktualizowała pracę nad podręcznikami uniwersyteckimi. 
W tym dopiero okresie został napisany ten na znacznie skrom- 
niejszą miarę zakrojony podręcznik. Był on planowany jako za- 
rys elementarny, umożliwiający osiągnięcie orjentacji ogólnej 
i praktyczne stosowanie metod statystycznych. Stanowi on wy- 
nik prac przygotowawczych do oddawna planowanego kompen- 
dium, nieukończonego wskutek przedwczesnej śmierci wielce 
zasłużonego uczonego. 


W Poznaniu, dnia 23. VIII. 1948 r. 


Jan Czekanowski 
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Obecność przeskoków w częstościach powoduje, że szeregi 
rozdzielcze poddaje się przekształceniom. Mianowicie łączy się 
wartości wariantów w grupy równej wielkości, tzw. klasy, 
i oblicza się częstości dla tych klas przez sumowanie częstości 
zawartych w nich wartości wariantów. Ilość łączonych wartości - 
należy wybrać o tyle dużą, żeby częstości obliczone dla klas 
zmieniały się stopniowo. Jeżeli w naszym materiale bławatka 
utworzymy klasy po dwie wartości, tego celu nie osiągniemy — 
przeskoki wprawdzie złagodnieją, ale zostaną. Widoczne to jest 
z następującego zestawienia: 


21—22 23—24 25—26 27—28 29—30 31—32 
2 5 9 26 24 49 


33—34 35—36 37—38 39—40 41—42 43—44 
40 38 34 22 28 9 
(3) 


45—46 47—48 49—50 51—52 53—54 55—56 


4 1 4 3 1 0 


57—58 59—60 61—62 
O E 0 1 


Trzeba wobec tego użyć podziałów klasowych większych 
Spróbujmy łączyć wartości wariantów po trzy. Możemy to 
uczynić w trojaki sposób, poczynając od wartości 19, 20 albo 
21. W ogóle jest tyle sposobów łączenia wariantów w klasy, 
ile jest wartości w klasie. Dla bławatka wobec tego będziemy 
mieli do wyboru trzy różne formy szeregu (4), (5) i (6). 


19—21 22—24 25—27 28—30, 31—33 34—36 
1 6 16 43 71 56 


37—39 40—42 43—45 46—48 49—51 52—54 
50 34 9 5 7 1 


55—57 58—60 61—63 
0 +20 1 


Zasady i metody statystyki 


23—25 26--—28 29—31 
9 31 43 


41—43 : 44—46 47—49 
33 8 4 


: 56—58 59—61 62—64 
0 0 1 


24—26 27—29 30—32 33—35 
dł 38 51 63 


42—44 45—47 48—50 51—53 
5 3,08 
57—59 60—62 
0 1 


Najlepiej wyrównaną formą szeregu jest trzecia (6). We 
wszystkich trzech bardzo nieprzyjemnie zaznacza się skrajny 
wariant 62, odległy od wszystkich innych. Takie skrajne wa- 
rianty czasem się odrzuca, czasem przeciwnie nadaje się im 
szczególne znaczenie. Kwestia ta będzie osobno omówiona 
w ust. 32. Wogóle w wyborze przedziałów klasowych należy 
kierować się tym, by częstości zmieniały się stopniowo. Poza 
tym dobrze jest zwrócić uwagę na to, by warianty o ile moż- 
ności były skupione w środkach klas. 

Szerokość klas nie powinna być zbyt duża, bo wtedy sze- 
reg wypadnie za krótki. Najdogodniejszą jest liczba klas między 
15 a 25. Nasz szereg jest właściwie trochę za krótki, bo wpraw- 
dzie w pierwszych dwóch formach ma 15 wyrazów (w trzeciej 
14), ale ostatni wyraz jest oddzielony od reszty dwiema (w trze- 
ciej formie jedną) pustymi klasami. 

Dalej ważną rzeczą przy opracowaniu szeregów rozdziel- 
czych jest ustalenie granic klas i ich wartości środ- 
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kowych. Granicami klasy nie są jej krańcowe wartości wa- 
riantów. Na przykład dla klasy 31—33 ani 31 nie jest granicą, 
ani 33. Granice klaswytycza się pośrodku mię- 
dzy ostatnią wartością jednej klasy a pierw- 
szą następnej. W ten sposób granicami klasy 31—33 będą 
liczby 30: i 33'/:. Będą to fikcyjne wartości zmiennej ewen- 
tualnej, żaden bowiem wariant nie ma ułamkowych wartości. 
Jest to jednak konieczne dla porównywania szeregów rozdziel- 
czych z ciągłymi funkcjami, co będzie rozpatrywane w rozdzia- 
łach IV i VI. 

Wyznaczanie środkowej wartości klasy, nazywanej także 
po prostu środkiem klasy, nie przedstawia żadnych trudności, 
jeżeli klasy zawierają nieparzystą ilość wartości wariantów. 
Tak jest z formami (4), (5) i (6) naszego szeregu, gdzie na przy- 
kład dla klasy 31—33 środkową wartością będzie 32. Zadanie 
jest bardziej zawiłe, jeżeli ilość wartości wariantów w klasach 
jest parzysta, jak w formie (3). Wtedy trzeba przyjąć jako war- 
tość Środkową fikcyjną wartość zmiennej ewentualnej po 
środku klasowego podziału. I tak w formie (3) dla klasy 31—32 
wartością środkową będzie liczba 31'2. 

Wartości środkowe są niezbędne dla rachunkowego opra- 
cowywania szeregów rozdzielczych. Wtedy, jak to zobaczymy 
w następnym rozdziale, służą one do wyznaczania numer ów 
klas. Te numery oblicza się, dzieląc wartości 
środkowe przez szerokość klas, to znaczy 
przez liczbę wartości wariantów w klasie. 
Otrzymuje się liczby całkowite, albo mieszane, np. w formie 
(5) otrzymamy numery 7, 8, 9, w formie zaś (4) 6%, 723, 
8%, .. . Liczby mieszane jako numery wyglądają trochę gro- 
teskowo, ale to nic nie szkodzi. Chodzi bowiem o to, że przez 
wprowadzenie ich można opracowywać szeregi tak, jakgdyby 
warianty nie były zgrupowane i jakgdyby w każdej klasie 
miały jednakową wartość, równą numerowi. danej klasy. N u- 
mery w tensposób będą niczym innym jak oso- 
bliwą formą zmiennej ewentualnej. Ze zwykłymi 
zmiennymi ewentualnymi mają one tę właściwość wspólną, że 
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w ciągach przez nie złożonych sąsiednie wyrazy różnią się o je- 
dynkę, tak samo jak w ciągach wartości zwykłych zmiennych 
ewentualnych. 

Jednocześnie z wprowadzeniem numerów klas trzeba zmie- 
nić liczbowe wartości granic, dzieląc je także przez szerokość 
klas. A więc granice dla szeregu formy (5) będą 6", 
7%, 8%,..., dla formy zaś (4) 6'/%, 7'/e, 8'le, ,,, Znowu otrzy- 
mujemy ciągi, których wyrazy różnią się o jedynkę. 


Jest często rzeczą korzystną podawać dla wartości warian- 
tów częstości względne, które otrzymuje się dzieląc 
częstości przez liczbę wariantów. W związku z tym dla unik- 
nięcia nieporozumień, częstości nazywa się nieraz często- 
ściami bezwzględnymi. Częstości względne są ułam- 
kami, których suma powinna być równa jedności. W praktyce 
różni się ona zwykle cokolwiek od jedności z powodu odrzu- 
cania dalszych dziesiętnych. 


Takie przeliczenia są pożyteczne między innymi przy po- 
równywaniu podobnych materiałów, zwłaszcza przy porówny- 
waniu różnych prób tej samej populacji. Naprzykład dla liczby 
kwiatów w szczytowych koszykach bławatka można przytoczyć 
oprócz podanego powyżej materiału z pól Zimnej Wody ma- 
teriał pochodzący z pewnej kultury Ogrodu Botanicznego 
w Dublanach (tabela 5,1) a liczący 200 wariantów. W tej tabeli 
ciągi wartości zmiennej ewentualnej i ich częstości są wypisane 
w pionowych szeregach a nie poziomych, jak dotąd. Jest to 
zwykle wygodniejsze. 

Zgrupujemy te dane w klasy po trzy, poczynając od war- 
tości 19 jak w zestawieniu (4). Przeliczając otrzymane częstości 
na częstości względne i zestawiając je z częstościami względ- 
nymi z materiału z Zimnej Wody, otrzymamy następujące po- 
równanie (tab. 5,2). 

Bardzo pożyteczne jest graficzne przedstawianie szeregów 
rozdzielczych. Są na to dwa sposoby. W pierwszym z nich na 
osi odciętych oznacza się wartości zmiennej ewentualnej albo 
dla materiałów grupowanych numery klas. 


Tabela 5,1 


Liczby kwiatów w szczytowych koszykach bławatka z kultury 
Nr 149 Ogrodu Botanicznego w Dublanach 


| 
Liczby | Ich czę- Liczby | Ich czę- Liczby Ich czę- 
kwiatów | stości kwiatów stości kwiatów stości 


4 
2 
2 
1 
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Tabela 5,2 


Zestawienie częstości względnych liczb‘ kwiatów w szczytowych 
koszykach bławatka z Dublan i Zimnej ] Yody 


Zakres klas | Dablany | Zimna Wod 


19-21 | "0,026 0,003 
a IA | 0,085 0,020 
25—27 0,115 0,053 
28—30 0,255 0,143 
31—33 0,235 0,237 
34—36 0,190 0,187 
37—39 0,085 0,167 
40—42 0,045 0,113 
43—45 0,010 0,030 
46—48 0,000 0,017 
49—51 | 0,005 0,023 
52—54 0,000 0,003 
55—57 0,000 0,000 
58—60 0,000 | 0,000 
61—63 0,000 


Sumy 1,000 


85 


Z tych punktów rysuje się rzędne o długoścach proporcjce- 
nalnych do odnośnych częstości. Łącząc wierzchołki rzędnych, 
otrzymuje się linię łamaną (ryc. 1). 

Dla materiału bławatka wznosi się ona i po osiągnięciu 
pewnego szczytu, odpowiadającego najczęstszej wartości, opada. 
W innych przypadkach może ta linia mieć inny kształt, np. 


78 9 10 n t2 13 14 15 16 17 18 19 20 21 220 


Ryc. 1. — Wykres zmienności dla liczby kwiatów w szczytowych 

koszykach bławatka z Zimnej Wody. Według drugiego sposobu 

grupowania materiału w klasy. Liczby u dołu oznaczają nu- 

mery klas, liczby u góry — częstości wariantów w odnośnych 
klasach. 


posiadać kilka wierzchołków itp. Nazywa się ją krzywą 
zmienności, jakkolwiek nie jest to krzywa. 


Daleko ważniejszą jest druga forma omawianych wykre- 
sów. Na osi odciętych zaznaczamy teraz granice klas. Robimy 
to nawet wtedy, kiedy warianty nie są grupowane. Wówczas te 
granice wytyczamy po środku między wartościami wariantów. 
Na zaznaczonych w ten sposób odcinkach o długościach rów- 
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nych jedności budujemy prostokąty o wysokościach równych 
odnośnym  częstościom. Otrzymamy  „schodkowaną” figurę 
o formie w ogólnych zarysach podobnej do „krzywej” pierw- 
szego sposobu (ryc. 2). 

Takie figury noszą nazwę „histogramów” według terminu 
wprowadzonego przez Pearsona. 


15,6 6 16 7 18 19,20 24 


Ryc. 2. — Histogram dla tego samego materiału staty- 
stycznego co w rys. 1. 


Histogramy są mało estetyczne. Ich wartość ujawnia się 
dopiero przy porównywaniu szeregów rozdzielczych z ciągłymi 
funkcjami, ale już teraz warto jest zaznaczyć, że pola prosto- 
kątów w histogramach są równe odnośnym częstościom, gdyż 
podstawy prostokątów są równe jedności. Suma tych pól równa 
się liczebności wariantów, w razie zaś użycia częstości względ- 
nych, równe są jedności. 

Skale odciętych i rzędnych w obu rodzajach wykresów 
mogą być różne, gdyż chodzi tu o różne rodzaje wielkości, od- 
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cięte bowiem przedstawiają wartości zmiennej ewentualnej lub 
numery klas, rzędne zaś ich częstości. 

Dotychczasowe wywody o szeregach rozdzielczych doty- 
czyły materiałów otrzymywanych przez zliczenia. W przypadku 
materiału pomiarowego opracowanie jego przedstawia się tak 
samo, gdyż ułamki figurujące w takich materiałach mają ten 
sam mianownik i są właściwie liczbami całkowitymi. Różnica 
polega na tym, że będziemy tu mieli liczby tak duże i przeto 
tak różne, że grupowanie wariantów w klasy będzie zawsze 
konieczne, podczas gdy przy materiale zliczeniowym może być 
zbyteczne, jak w przytoczonym powyżej materiale przylaszczki. 
l tak w pierwszym przykładzie ust. 1 mamy milionowe części 
yarda, wahające się w granicach od 228 do 635. Jest tu w pró- 
bie złożonej tak samo z 40 wariantów nie 15 jak w przypadku 
bławatka, lecz aż 38 różnych wariantów, z których powtarzają 
się tylko dwa: 378 i 448. 


Szerokości klas w materiałach pomiarowych bierze się 


zwykle w wymiarze 10 lub wielokrotności tej liczby. Jako 
pierwszy wariant każdej klasy bierze się liczby wielokrotne 10. 
Od tego prawidła odstępuje się tylko wtedy, jeżeli te wielokrot- 
ności występują szczególnie często, co jest skutkiem zaokrągla- 
nia liczb. Dla pierwszego przykładu ust. 1 trzeba będzie wziąć 
szerokość klas w wymiarze stu jednostek o Sb: i sze- 
reg będzie miał formę: 


200—299 300—399 400—499 500—599 600—699 
8 13 14 4 ft 


Trzeba przytem pamiętać, że jednostką pomiarową dla zmien- 
nej ewentualnej jest w nim milionowa część yarda. 


W tej formie szereg jest całkowicie wyrównany. Wadą 
jego jest to, że ma za mało wyrazów, co jest nieuniknione wo- 
bec szczupłości materiału. Zarówno granice klas, jak i wartości 
środkowe będą reprezentowane przez fikcyjne wartości zmien- 
nej ewentualnej, Naprzykład dla klasy 400—499 granicami 


będą liczby 399": i 499'/:, środkiem zaś liczba 449,5 (nie 450). 
Numerami klas będą liczby mieszane, naprzykład dla przyto- 
czonej klasy będzie to liczba 4.495. 


„A Dla skrócenia można klasy oznaczać przez same tylko po- 
czątkowe wartości wariantów w klasach z dodaniem kreski. 
Naprzykład omawiany szereg pomiarowy można napisać 
w formie: 

200 — 

300 — - 

400 — 

500 — 

600 — 1 


6. Formy prostych szeregów rozdzielczycn. Już z przy- 
toczonych w poprzednim ustępie przykładów widoczne są dwie 
różne formy szeregów rozdzielczych: dwuboczna, jak 
w przykładach bławatka i pomiarów podziałki, i jedno- 
boczna, jak u przylaszczki. Jest jeszcze trzecia bardzo 
rzadka forma — szeregu wklęsłego. Inne jeszcze for- 
my powstają, jeżeli materiał składa się z dwóch lub kilku róż- 
nych materiałów zestawionych razem. Będzie o tym mowa oso- 
bno w ust. 7. 


Przyjrzyjmy się formie obu przytoczonych dwubocznych 
szeregów. Widzimy, że w środkowej ich części jedna z klas ma 
większą częstość, niż inne. Reprezentuje ona t. zw. modalną 
wartość wariantów, bardzo ważną dla charakterystyki ma- 
teriałów statystycznych. Porównując ze sobą częstości klas po- 
łożonych na jednakowej odległości po obu stronach klasy mo- 
dalnej, widzimy, że są one nierówne: w przypadku bławatka 
większe są częstości wariantów większych od wartości modal- 
nej, w przypadku pomiarów podziałki przeciwnie, większa 
jest częstość wariantów mniejszych. Oba szeregi wykazują za- 
tem wyraźną asymetrię, inaczej mówiąc skośność. 
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Można powiedzieć, że w pierwszym z tych szeregów jest ona 
dodatnia, w drugim ujemna. 


Tak jest zazwyczaj. Szeregi symetryczne są rzadkie. 
Klasycznym ich przykładem są szeregi rozdzielcze wzrostu lu- 
dzi. Najlepszym znanym autorowi materiałem tego rodzaju 
jest ' zestawienie, ogłoszone przez Lindersa') (tab. 6,2). 
Dotyczy ono 46981 mężczyzn w wieku między 20 a 22 lat z armii 
i floty szwedzkiej. Wartości wzrostu są podane w przedziałacn 
centymetrowych. Trzeba je wobec tego traktować tak, jak gdy- 
by były wykonane w milimetrach. 


Przykładem symetrycznej krzywej może służyć także 
otrzymany przez autora szereg rozdzielczy dla liczby kwiatów 
w koszykach sałatnicy (Aposeris foetida) (tab. 6,2) zebranej 
w lesie Suchowoli pod Lwowem. Z każdego okazu był wzięty 
jeden koszyk. Koszyki u tej rośliny są pojedyńcze, ale łodyg 
kwiatowych wyrasta u tego samego okazu zwykle większa 


ilość. Warto jest zaznaczyć, że tak samo w tym przykładzie, 
jak i poprzednim, są pewne odchylenia od symetrii — bez tego 
nigdy się nie obchodzi. 


W przeciwieństwie do liczby: kwiatów w koszykach ilość 
wewnętrznych listków okrywy u tej samej rośliny dała szereg 
z wyraźną symetrią dodatnią (por. drugą część tejże tabeli 6,2). 
Nie jest to bynajmniej fakt odosobniony, że różne cechy tego 
samego organizmu dają szeregi rozdzielcze o różnym charak- 
terze. I tak podczas gdy wzrost ludzi układa się w szeregi 
symetryczne, ich waga daje szeregi asymetryczne. Jako przy- 
kład przytaczam za Yule'm dane angielskie. Wagę noto- 
wano w okrągłych funtach (tab. 6,3). Asymetria jest tu silna 
i wybitnie dodatnia. 


Odnośnie do listków okrywy u sałatnicy warto jeszcze do- 


1) F, J. Linders. Contributions to the knowledge of the stature 
and its variation within different social strata in Sweden. — Geogra- 
fiska Annaler. 1930. 
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dać jedną ważną uwagę. Wyróżnia się ten materiał poza asy- 
metrią jeszcze jedną ważną cechą, mianowicie tym, że modal- 
na wartość ma częstość znacznie większą od sąsiednch. 


Tabela 6,1 
Wzrost 46981 Szwedów. 


Wzrost w ć i Wzrost w > pia 
Częstość Częstość 
mm mm 


1740— | 
1750— 
1760— 
1770— 
1780— 
1790— 
1800— 
1810— 
1820— 
18380— 
1840— 
1850— 
1660— 
1870— 
1880— 
1660— | - 2146 1890— 
1680— | 233 1910— 
1690— | 286 1920— 
1700— 30; 1930— 
1710— | 32115 1940— 
1720— | 308 1950— 
1730— 3098 1960— 
1970— 


Tabela 6,2 
Sałatnica (Aposeris foetida) 


Liczby osob- 

pików z taki 

mi ilościami 
kwiatów 


Ilość 
kwiatów 
w koszykach 


Ilości Liczby osob- 
listków ników z taki: 
okrywy mi okrywami 


20 


OSE 


A 


ro ro to NDO 
oi |do) 


CJ 
Gi 
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Ogółem 300 


Tego rodzaju szeregi rozdzielcze są częste u roślin, m. i. 
kiedy chodzi o liczbę kwiatów języczkowych w koszykach zło- 
żonych. Jako przykład podam materiał dla Senecio fluviatilis 
według kultury Ogrodu Botanicznego w Dublanach (tab. 6,4). 
W ust. 7 będą podane dwa podobr e zliczenia dla Chrysanthe- 
mum segetum (tab. 7,9). U zs ierzął takie zjawiska są rzadkie. 
Warto jest przytoczyć w tym względzie zliczenie A. G. 
Mayera odnośnie do liczby promieni u meduzy Pseudoclytia 
pentata (tab. 6,5). Ś 


Tabela 6,3 
Waga dorosłych Anglików. 


Waga w fun- Ilość osób 
tach angielskich o takiej wadze 


90— 2 
100— 34 
110— 152 
120— 390 
130— 867 
140— 1623 
150— 1559 
160— 1326 
170— T87 
180— 416 
190— 268 
200— 
210— 
220— 
230— 
240— 
250— 
260— 
270— 
280— 


Ogółem 7749 


Tabela 6,4 Tabela 6,5 
Liczby kwiatów  języczko- Liczby promieni u meduzy 
wych w szczytowych koszy- Pseudoclytia pentata. 
kach Senecio fluviatilis. 
Liczby Ich 
Liczby Ich promieni częstości 
kwiatów częstości R WAYNE TI WOSK EAE T 
1 
14 
43 


00 I O OI A W LO 


§ 6 


Podam jeszcze kilka przykładów dwubocznych szeregów 
z różnych dziedzin. Bardzo ciekawe są m. i. materiały meteoro- 
logiczne a to przez swój rozmaity charakter. Dają one krzywe 
zmienności symetryczne, skośne, jednoboczne i wklęsłe. I tak 
średnie temperatury powietrza w Krakowie w lipcu dają szereg 
symetryczny, natomiast temperatury styczniowe —'szereg þar- 
dzo silnie skośny (tab. 6,6 i 7). W obu przypadkach zliczenia 
opierają się na 25-letnich obserwacjach z lat 1886—1910. Tem- 
peratury są w nich zaokrąglone do całych stopni, zatem klasa k 
obejmuje temperatury od k— 0.4 do k + 0.5”. Inne przykłady 
materiałów meteorologicznych będą przytoczone w dalszych 
częściach tego ustępu. 


Tabela 6,6 
Średnie temperatury dobowe lipca w Krakowie 
(1886—1910) 


| Częstości zgrupo- 
wane w klasy po 3? 


Temperatury Ich częstości 


Tabela 6,7 


Średnie dobowe temperatury stycznia w Krakowie 
(1886—1910) 


Częstości 


Temperatury Ich częstości 
zgrupowane po 37 


DROÓOWHMOMOCOP 


Ogółem 
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Bardzo ciekawy szereg rozdzielczy zestawił J. Witkow- 
ski dla błędów obserwacyj astronomicznych '). Są to różnice 
miedzy kolejnymi obserwacjami rektascencji gwiazd, dokona- 
nymi przez J. Kowalczyka w Warszawie. Materiał został 
zgrupowany w klasy szerokości 0.15 sekundy (tab. 6,8). Dzięki 
temu, że liczba wartości wariantów w klasach jest nieparzysta, 
środkowe wartości w tym przykładzie przypadają na realne, nie 
fikcyjne wartości zmiennej ewentualnej. 


Tabela 6,8 
Różnice między kolejnymi obserwacjami rektascencji gwiazd. 


Środki klas Ilości przypadków 


— 0,90 
— 0,75 
—0,60 
— 0,45 
— 0,30 
—0,15 
— 0,00 
+ 0,15 
+ 0,30 
+0,45 
+ 0,60 
+ 0,75 
+ 0,90 


Ogółem 


Przytaczam dalej przykład z dziedziny zoologii. Dotyczy on 
liczby promieni w płetwach ogonowych flądry (Pleuronectes), 
złowionych koło Skagen i zbadanych przez C. G. Petersena 
(tab. 6,9). Zapożyczam go z książki Johannsena. Asymetria 
szeregu jest dodatnia. 


1) J. Witkowski. An astronomical example of a non-Gaus- 
sian frequency curve. — Bull Acad. Polon, Sc. et L. Série A. 1923. 


; Tabela 6,9 
Liczby promieni w płetwach ogonowych flądry. 


Liczby promieni ilości osobników 


1 

2 

5 

£ 9 
13 

12 

11 

7 

3 

1 


5 
2 
3 
3 
8 
6 
4 
T 
1 
4 
7 
6 
4 
2 
1 
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Przechodzimy do szeregów jednobocznych. Już w ust. 5 
przytoczyłem przykład takiego szeregu dla liczby płatków 
u przylaszczki (Anemone Hepatica), oparty na czterdziestkowej 
próbie. Podaję poniżej zestawienie obfitszego materiału (tab. 
6, 10).'W tej tabeli podaję także podobne dane dla jaskrów 
(Ranunculus) według moich obserwacyj w okolicach Zimnej 
Wody i Suchowoli pod Lwowem. Zbierałem kwiaty w odległości 
kilku metrów jeden od drugiego, ażeby w miarę możności re- 
prezentowały inne osobniki a nie klony. Z każdego osobnika 
brałem jeden kwiat. Z jaskrów brałem tylko kwiaty szczytowe, 
gdyż u nich zaznacza się podobna różnica między różnie po- 
łożonymi kwiatami, jak u maku (por. ust. 2). Z przylaszczką nie 
było tego kłopotu, bo kwiaty są pojedyńcze. 


Zasady i metody statystyki 


Tabela 6,10 
Częstość ilości płatków u jaskrowatych. 


Ilość Ilości płatków 
Nazwa rośliny obser- - iD —— 
- wacyj r 6 8 


Anemone hepatica 439 204 
Ranunculus poly- 
anthemos 428 |410| 16 
R. acer 518 |458| 47 
R. repens 413 |314| 56 
R. flammula 145 |111| 24 


Co do jaskrów warto jest zaznaczyć, że w ich kwiatach 
zmienność liczby owocków jest zgoła inna niż płatków: otrzy- 
muje się dwuboczne szeregi symetryczne. Naprzykład dla 
R.acer otrzymałem w Krynicy wynik zliczeń zestawiony 
w tab. 6,11. 


s Tabela 6,11 
Liczby owocków w szczytowych kwiatach Ranunculus acer. 


AO 


| 
| 


Liczby Ich czę- 
owocków stości 


15 — 
20 — Różnica w zmienności różnych cech 
"R | tego samego organizmu jest tu 
35 — dag jaskrawa, o wiele silniejsza niż 
AO w  omówionym poprzednio przy- 
aD== padku wzrostu i wagi ludzi. 

50 — £ 
55 — 


aerea e eE a IĘYT 


-A 


- Ogółem 


ZZ a EE W A 


3 6 35 


Jednoboczne krzywe zmienności nie są rzadkie w meteoro- 
logii. Naprzykład Charlier podał bardzo ciekawy przykład 
odnośnie do ilości dni z burzami (wyładowaniami elektrycz- 
nymi) dla Lundu za okres 105-letni (1753-1857). Liczby tabeli 
6,12 podają, ile było lat, w których dany miesiąc wykazywał 
tyle a tyle dni z burzami. 


Tabela 6,12 
Ilości lat w których poszczególne miesiące miały 
tyle a tyle dni z burzami. Obserwacje w Lund z lat 
1753—1857. 


Dni 
z bu- 
rzami 


| ĘŻA= 


Podaję wreszcie sławny przykład Bortkiewicza, do- 
tyczący częstości wypadków śmierci od kopnięcia konia 
w 10 korpusach armii pruskiej w poszczególnych latach 
20-letniego okresu (tab. 6,13). Liczby tej tabeli podają, ile było 
korpusów, w których zdarzyło się tyle a tyle przypadków 
śmierci w ciągu roku. 


Tabela 6,13 
Wypadki śmierci od kopnięcia konia. 
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Ilości wypadków 
w ciągu roku 


0 190 


Ich częstości 


1 | 65 
2 | 22 
3 | 3 
4 1 


Ogółem 200 

W końcu trzeba omówić szeregi rozdzielcze wklęsłe. 
W nich najczęstsze są skrajne wartości wariantów: najmniej- 
sze i największe. Tylko stopnie zachmurzenia dają wyraźne 
szeregi tego rodzaju. Na przykład dla Bazylei otrzymano nastę- 
pujący szereg według obserwacyj z okresu 1907—10 (tab. 6, 14). 

Yule. podaje jeszcze przykład ze statystyki amerykań+ 
skiej, dotyczący ilości głuchoniemych wśród dzieci rodziców, 
z których przynajmniej jedno było dotknięte tym kalectwem, 
ale sam przyznaje, że materiał jest zbyt szczupły, by zapewnić 
szeregowi wyraźną formę. To też pomijam ten przykład. 


Tabela 6,14 
Częstości stopni zachmurzenia w Bazylei dla lat 1907—1910. 


Stopnie Ich częstości 
zach murzenia względne 


0,138 
0,062 
0,051 
0,047 
0,039 
0,034 
0,033 
0,048 
0,052 
0,078 
0,418 


Suma | 1,000 
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7. Szeregi rozdzielcze złożone. Ma się je wtedy, kiedy ma- 
teriał statystyczny jest mieszaniną wariantów, pochodzących 
z dwu albo kilku różnych populacyj. Jest to zjawisko bardzo 
nieprzyjemne, bo nieraz złożoność szeregu nie przejawia się 
w jego charakterze. Tak się dzieje, kiedy są zmieszane dwa 
materiały symetryczne mniej więcej jednakowo liczne o po- 
dobnym charakterze, ale z częstościami przesuniętymi w stronę 
mniejszych lub większych wartości wariantów. Naprzykład 
mamy w tabeli 7,1 zestawione takie dwa fikcyjne szeregi (1) 
i (2), z których drugi ma częstości przesunięte o 2 wyrazy 
w stronę większych wartości wariantów. Podaję tu, tak samo 
jak w dalszych zestawieniach, tylko ciągi częstości z pominię- 
ciem wartości wariantów, które są obojętne. 


Tabeła 7,1 


64 98 11i2 98 


Częstości wartości modalnych są zaznaczone tłustym dru- 
kiem. Złączone ze sobą, te dwa materiały dają szereg (3) tak 
samo symetryczny. 

Jeżeli jeden z takich szeregów będzie bardziej liczny, 
powstanie szereg skośny. Tak wypadnie naprzykład, jeżeli 
drugi ze składanych szeregów będzie trzy razy liczniejszy 
(tab. 7,2). 


Tabela 7,2 


10 96 29 8 1 
24 84 168 210 168 84 


8 31 80 154 224 238 176 85, 24 


Tym bardziej tak będzie, jeżeli składane szeregi mają nie- 
tylko różną liczebność, ale także różne stosunki częstości, po- 


zostając zresztą symetryczne. Naprzykład tak będzie w zesta- 
wieniu tabeli 7,3. 


Tabela 7,3 


56 
20 


76 


Niewątpliwie nie jeden skośny szereg zawdzięcza tę cechę 
swojej złożoności. Nie można tego jednak twierdzić napewno. 
Natomiast jeżeli szereg ma dwie albo więcej wartości warian- 
tów o częstościach większych niż sąsiednie, jeżeli innymi 
słowami ma dwa lub więcej „szczytów ”, to jego złożoność nie 
ulega wątpliwości. Musi to być zresztą szereg o dużej liczeb- 
ności, bo przeskoki w częstościach, o których była mowa 
w ust. 4, mogą tworzyć szczyty iluzoryczne. 


Tego rodzaju szereg otrzymamy naprzykład, jeżeli do 
szeregu (1) dodamy drugi o częstościach przesuniętych nie 
o 2 wyrazy, lecz o 4 (tab. 7,4). 


Tabela 7,4 


1 8 26 56 70 56 28 8 1 — — — — 
= mo ok B 22051565 TOO AB 73 


1.8 28 56 71 64 56 64 71 56 28 8 1 


Przytoczę w dalszym ciągu realne przykłady złożonych 
szeregów. I tak Ludwig‘) ogłosił następujące zestawienie 
liczb promieni w szczytowych baldachach  podagrycznika 
(Aegopodium Podagraria), rośliny z rodziny baldaszkowych 
(tab 7,5). Wystąpiło tu zjawisko bardzo ciekawe: szczyty od- 
dalone od siebie o trzy wyrazy szeregu. Autor tej książki wyka- 


1) F. Ludwig. Ueber Variationskurven und Variationsfliichen 
der Pflanzen. — Botan. Centralbl. Vol. 64 (1895). 


$ 7 | 39 
zał, że to zjawisko jest bardzo rozpowszechnione w rodzinie bal- 
daszkowatych '). 
Tabela 7,5 
Liczby promieni w szczytowych baldachach podagrycznika. 
Q5:40:58F8 13-.14. 15: 116.17 
22 46 92 126 120 127 


23. 24-25 27 
825 34 8 


Nie mniej ciekawy jest przykład drugi, który zawdzię- 
czamy również Ludwigowi?). Dotyczy on liczby kwiatów 
w kwiatostanach pierwiosnka (Primula officinalis). Szczytów 


jest aż pięć! (tab. 7,6). 


Tabela 7,6 
Liczby kwiatów w kwiatostanach pierwiosnka. 


PAA BŁ: „OLI pł AEE TT | USA B R Droe o SS E. B 15 
13 78 54 237 173 116 188 76 108 56 19 21 10 6 


16..17..18 19 20 21 22 
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Cztery z pomiędzy tych szczytów a mianowicie 3, 5, 8 i 13 
są reprezentowane przez tzw. szereg Fibonacciego na- 
zwany tak na cześć włoskiego matematyka z XIII wieku. Sze- 

) D. Szymkiewicz. Observations biométriques. I. — Acta 
Soc. Bot. Polon. Vol. 9 (1932). 

2) F. Ludwig. Eine finfgipfelige Variationskurve. — Ber. 
Deutsch. Botan. Ges. Vol. 14 (1896). 


$7 


reg ten zaczyna się od jedynki i dwójki a jego dalsze wyrazy 
tworzą się przez dodawanie dwóch poprzednich. Piąty szczyt 
ma wartość także jednej z liczb Fibonacci'ego, ale po- 
mnożonej przez dwa: 10=5X2. Tego rodzaju liczby bardzo 
często charakteryzują wartości modalne u roślin. Już po- 
przednio mieliśmy 8 jako wartość modalną w okrywie sałatnicy 
(tab. 6,2):i dla kwiatów języczkowych Senecio fluviatilis (tab. 
6,4). Zjawisko to nosi miano prawa Ludwiga. 


Jako przykłąd szeregu wieloszczytowego z dziedziny zoolo- 
gii przytoczę pomiary wyrostków odwłoka u skorka (Forficula) 
wykonane przez Batesona/) (tab. 7,7). 


Tabela 7,7 


Częstość długości wyrostków odwłoka u skorka, 
wymierzonych w mm. 


30 35.40 45 5.0 - 55 -6.0: «6.5 + *7.0 
64 125 7 12 24 42 42 90 


4.90 2-80 
68 44 


Różnice w biologicznych materiałach, powodujące wytwo- 
rzenie wieloszczytowych szeregów rozdzielczych, mogą wyni- 
kać ze zróżnicowania organizmów na gatunki elementarne. 
I tak de Vries*) zbadał jednoroczną roślinę z rodziny zło- 
żonych Chrysanthemum segetum. Dała ona dla liczby kwia- 
tów języczkowych w szczytowych koszykach krzywą zmień- 
ności ze szczytami przy 13 i 21 liczbach Fibonacciego 
(tab. 7,8). 


5 Bateson. Materials for the study of variations — Lon- 
don. 1894. 

*) H. de Vries. Ueber Curvenselection bei Chrysanthemum se- 
getum. — Ber. Deutsch. Botan. Ges. Vol. 17 (1899). 


Tabela 7,8 
Kwiaty języczkowe u Chrysathemum segetum. 


10 1 1 13 - 10a 17 
153 55 31 


23 26 
1 1 


Przez selekcję udało się temu badaczowi wyosobnić dwa 
gatunki elementarne o jednoszczytowych krzywych zmienności 
dla liczby kwiatów języczkowych. Jeden z nich dał szereg ze 
szczytem przy 13, drugi przy 21 (tab. 7,9). 


AE 


Tabela 7,9 
Kwiaty języczkowe u Chrysanthemum segetum 
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A ROZDZIAŁ II. 
PODSTAWOWE CHARAKTERYSTYKI MATERIAŁÓW 
STATYSTYCZNYCH 


8. Wstępne uwagi. Zgodnie zogólnym zadaniem 
statystyki najważniejszym zagadnieniem ba- 
dania populacyj jest wyszukanie możliwie 
mało licznych wielkości, któreby je charakte- 
ryzowały w sposób możliwie najbardziej po- 
glądowy i dokładny zarazem. Są to tzw. cha- 
rakterystyki. Zadaniem tego rozdziału jest omówienie 
podstawowych wielkości tego rodzaju, mianowicie wartości 
modalnej, średniej arytmetycznej i obliczo- 
nych względem niej momentów. 

Z tych charakterystyk podstawowych wypadnie wypro- 
wadzić jeszcze dalsze, pochodne jak to się mówi: odchyle- 
nie przeciętne i średnie, skośność i inne, co będzie przedmio- 
tem następnego rozdziału. 

9. Wartość modalna. Jest to najczęstsza wartość 
wariantów, o której już była mowa w poprzednim roz- 
dziale. Najłatwiej daje się ona ustalić dla szeregów rozdziel- 
czych o niegrupowanych wartościach wariantów. I tak w ust. 6 
mieliśmy liczne przykłady: dla liczby kwiatów w koszykach 
sałatnicy wartość modalna była 17, dla liczby wewnętrznych 
listków okrywy u tejże rośliny 8 (tab. 6,2), dla liczby promieni 
u meduzy Pseudoclytia pentata 5 (tab. 65), dla liczby promieni 
w płetwach ogonowych flądry 53 (tab. 6,9) itd. U roślin ta 
wartość bardzo często równa się liczbom szeregu Fibonac- 
ci'ego, o czym już była mowa w ust. 6. 


89, 10 43 


Ustalenie wartości modalnej dla szeregów o zgrupowa- 
nych wariantach jest o wiele trudniejsze. Łatwo jest wpraw- 
dzie wskazać klasę o największej częstości, ale to nie daje ża- 
dnej określonej liczby, co najwyżej określa granice, w których 
się ona mieści. Chcąc w tym przypadku wyznaczyć określoną 
wartość, trzeba wyznaczyć częstości wartości wariantów za 
pomocą ciągłej funkcji i wybrać największą wartość tej funk- 
cji z pomiędzy jej wartości dla poszczególnych wartości wa- 
riantów. Odpowiadająca jej wartość zmiennej ewentualnej 
będzie wartością modalną. Zadanie to będzie rozpatrzone 
w rozdziale VI. Tam w ust. 36 tab. 4 będzie tytułem przykładu 
wyznaczona wartość modalna dla liczby kwiatów w szczyto- 
wych koszykach bławatka. Wypada ona równa 34, liczbie 
z szeregu Fibonacci'ego. 

Wyznaczenie wartości modalnej wymaga dużego mate- 
riału, tym większego im większa jest ta wartość. Wobec tego 
na przykład wartość modalna 34 dla bławatka przy 300 wa- 
riantach jest niepewna, tak samo wartość modalna 53 dla flądry 
przy 103 wariantach, natomiast wartość 8, dla kwiatów języcz- 
kowych w koszykach Senecio fluviatilis jest ustalona pomimo 
176 zaledwie wariantów (tab. 6,4). 

Jeżeli szereg jest wieloszczytowy, szczytowe wartości wa- 
riantów mogą być uważane za pewnego rodzaju wartości mo- 
dalne. ` 


10. Średnia arytmetyczna i geometryczna. Średnia arytme- 
tyczna, od której zaczniemy, jest w zespole charakterystyk 
wielkością podstawową, bo prawie wszystkie charakterystyki 
Są z nią w ten czy inny sposób związane. Jak to powszechnie 
jest wiadome, średnia arytmetyczna jest ilora- 
zem od podzielenia sumy wariantów -przez 
ich liczbę. Jeżeli zatem oznaczymy warianty przez symbole 
U, U,, U,, . . . U, gdzie n jest ich liczba, to możemy napisać 
że ich Średnia arytmetyczna m równa się 


LAG TA Gap 
n 


m u = 


5 10 


Oznaczyliśmy tu średnią arytmetyczną symbolem u, to 
znaczy symbolem wariantów z kreską u góry. Takie znako- 
wanie jest bardzo wygodne, bo wskazuje odrazu z jakich wiel- 
kości średnia arytmetyczna została wyprowadzona. 


Będziemy w tym zagadnieniu, jak i w wielu dalszych, po- 
sługiwali się symbolem £. Oznacza on sumę wielkości, sta- 
nowiących pewien zespół albo sumę wartości jakiejś funkcji 
takich wielkości. Wielkości te oznacza się. pewną literą z do- 
daniem u dołu litery i, zaznaczającej numerację rozpatrywa- 
nych wielkości. Po znaku 2 pisze się symbol danych wiel- 
kości albo symbol funkcji. W ten sposób sumowanie warian- 
tów dla obliczenia średniej arytmetycznej może być oznaczone 
przez wyrażenie Xu. Dla bliższego określenia, które wielkości są 
sumowane, pisze się u dołu litery £ numer pierwszej z nich, 
u góry zaś numer ostatniej. Naprzykład gdyby chodziło o zsu- 
mowanie wariantów od drugiego do ósmego, napisalibyśmy 


Xu. Dla obliczenia średniej arytmetycznej sumuje się wszyst- 
2 


kie n wariantów. Wobec tego wzór dla tej charakterystyki 
będzie 


(1) 


W związku z użyciem symbolu X) należy pamiętać 
o tym, że sumowanie może być algebraiczne i arytmetyczne. 
Pierwsze wykonuje się w ten sposób, że dodaje się osobno do- 
datnie i ujemne składniki i od sumy dodatnich odejmuje się 
sumę ujemnych. Wynik może wypaść dodatni lub ujemny. 
Przy sumowaniu algebraicznym symbole sumowanych wielko- 
ści wpisuje się za znakiem % bez żadnych szczególnych od- 
znak. Inaczej jest przy sumowaniu arytmetycznym — tu 
dodaje się razem wszystkie liczby bez względu na znak, uwa- 
żając je wszystkie za dodatnie. Innymi słowami sumuje się 
absolutne wartości liczb. W tym przypadku symbol 
sumowanych wielkości za znakiem % ujmuje się w nawias 


$ 10 45 


złożony. z pionowych kresek, np. w ust. 17 spotkamy się 


n 


z wyrażeniem X |y, — u . Taki nawias oznacza absolutną 
1 


wartość danej wielkości. Jeżeli nie będzie to spe- 
cjalnie zaznaczone, wszystkie sumy w tej 
książce należy rozumieć jako algebraiczne. 


Wartość Średniej arytmetycznej jest pośrednia między 
wartościami wariantów. Stanowi ona pewnego rodzaju ośro- 
dek w ich zbiorze. Nazwa jej podkreśla tę właściwość. Dla 
skrócenia nazywa się ją nieraz po prostu Średnią. 


Jeżeli materiał statystyczny jest niewielki, obliczenie śre- 
dniej arytmetycznej nie sprawia żadnych trudności. Może 
tylko chodzić o dokładność wyników. Otóż można przy- 
jać za zasadę przy wszelkich obliczeniach, że 
wynikniepowinienzawieraćwięcejniżcztery 
„cyfry. Zwykle wystarczają nawet trzy. W tym prawidle zera 
przed znaczącymi cyframi nie liczą się, liczą się natomiast je- 
żeli występują na końcu. Naprzykład liczba 0.02750 ma cztery 
cyfry, nie sześć, zresztą także nie trzy. Powyższe prawidło do- 
tyczy tylko ostatecznego wyniku. Natomiast obliczenia trzeba 
nieraz przeprowadzić z większą ilością znaków dziesiętnych. Na 
ogół trzeba mieć o dwa więcej niż ich ma być w wyniku osta- 
tecznym, by otrzymać dokładną cyfrę dla ostatniego znaku. 


Warto jest jeszcze przy rachunkach zwrócić uwagę na na- 
stępujący szczegół. Wypada często w wynikach odrzucać dal- 
sze znaki dziesiętne. Przyjęto powszechnie, że jeżeli odrzucone 
cyfry dają liczbę mniejszą od połowy jednostki ostatniej zacho- 
wanej cyfry albo równą połowie, to tę cyfrę zostawia się bez 
zmiany, w przeciwnym zaś razie powiększa się ją o jedynkę. 
Ustalony w ten sposób wynik jest zatem nieco mniejszy albo 
nieco większy od dokładnej wartości. Otóż dobrze jest wie- 
dzieć, czy jest on mniejszy od niej, czy większy. W tym celu 
należy ostatnią cyfrę wyniku podkreślać, jeżeli jest on więk- 
szy. I tak, naprzykład, jeżeli zamiast 5.286 weźmiemy 5.29, to 
należy 9 podkreślić. 
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Użyteczność takiego znakowania ujawnia się nieraz, jeżeli 
wynik podlega dalszym rachunkom. Przypuśćmy, że podaną 
powyżej liczbę 5.29 trzeba podzielić przez dwa z zachowaniem 
tej samej liczby znaków dziesiętnych. Będziemy wtedy w kło- 
pocie, czy mamy wziąć 2.64 czy 2.65, jeżeli nie będziemy wie- 
dzieli, czy ta liczba 5.29 była obliczona z nadmiarem, czy z nie- 
dostatkiem. W pierwszym przypadku iloraz będzie 2.64, 
w drugim 2.65. 

Użyteczność omawianego znakowania ujawnia się także 
wtedy, kiedy trzeba odrzucić ostatnią cyfrę a nią jest 5, na- 
przykład gdy chodzi o liczbę 7.385. Czy wziąć 7.38 czy 7.39? 
Oczywiście jeżeli to będzie 7.385, trzeba będzie wziąć 7.38, je- 
żeli zaś 7.385 bez podkreślenia — to 7.39. Takie piątki na 
końcu liczb są bardzo nieprzyjemne i zmuszają nieraz do obli- 
czania dalszych znaków dziesiętnych. 

Jeżeli materiał statystyczny jest duży, obliczanie średniej 
arytmetycznej jest bardziej zawiłe. Materiał ma wtedy formę 
-szeregu rozdzielczego. Przypuśćmy, że wartości wariantów są 
w liczbie l: X1; ©, Xg.. ©. Stanowią one zmienną ewentu- 
alną, o której była mowa w ust. 5. Niech ich częstości będą 
odpowiednio f,, fa fs, „fu przy czym suma tych częstości 
równa się n, liczbie wariantów. Wtedy średnia arytmetyczna 
zostanie określona równaniem: 


sy Byc: fs To Daly 
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Średnią arytmetyczną wariantów można uważać za śre- 
dnią arytmetyczną wartości wariantów, ale z tym zastrzeże- 
niem, że to będzie średnia ważona. Tak nazywa się Średnia 
arytmetyczna liczb, różniących się między sobą pod względem 
swojego znaczenia w danym zagadnieniu. Wtedy każda taka 
liczba ma swoją ,wagę”, określającą to znaczenie, a Średnią 
arytmetyczną otrzymuje się, mnożąc każdą liczbę przez jej wagę 
i dzieląc sumę takich iloczynów przez sumę wag. Tak właśnie 
przedstawia się wzór (2) podany powyżej.. W nim rolę wag dla 


$ 10 


wartości zmiennej ewentualnej x odgrywają częstości f tych 
wartości. Średnią ważoną oznacza się podobnie jak zwykłą 
średnią przez symbol składników z kreską u góry, ale po- 
dwójną. Można więc napisać: 


m=u=x 


Ze średnią arytmetyczną ważoną ma się do czynienia m. i. 
wtedy, kiedy trzeba przeprowadzić obliczenia, nie mając bez- 
pośrednio . wariantów, mając tylko częściowe Średnie arytme- 
tyczne, to znaczy jeżeli zbiór wariantów został podzielony na 
części i dla każdej części z osobna była obliczona średnia. Wagą 
każdej takiej częściowej Średniej będzie liczba wariantów, 
z których ona była obliczona. I tak przypuśćmy, że mamy do 
dyspozycji trzy Średnie częściowe: jedną o wartości 5.2 dla 
12 wariantów, drugą 7.1 dla 20 wariantów i trzecią 9.0 dla 5 
wariantów. Średnią arytmetyczną ważoną obliczymy według 
wzoru 


5.2x12+7.1 X 20 +9.0x5 
12 + 20 +5 


= 6.7. 
Byłoby natomiast błędnym obliczanie średniej arytmetycznej 
w tym przypadku według wzoru 


5.2 F 7.1 t,9.0 
3 — 


7.1, 


gdyż omawiane wielkości, dla których ma być znaleziona śŚre- 
dnia, nie są równoważne: największe znaczenie ma 7.1 repre- 
zentująca 20 wariantów, najmniejsze 9.0, reprezentująca 
tylko 5. 


Równania (1) i (2) mogą służyć do obliczenia średniej aryt- 
metycznej. Lepiej jest jednak przy dużej ilości wariantów 
uprościć sobie. zadanie przez zastosowanie metody warto- 
Ści wyjściowej. Metoda ta opiera się. na podstawowej 
własności średniej arytmetycznej, którą można sformułować 
w sposób następujący: suma algebraiczna odchyleń 
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wariantów od ich średniej równa się zeru. Od- 
chyleniami nazywamy różnice między wariantami a jakąś 
stałą wielkością. Jeżeli tę wielkość. oznaczymy przez a, wzór 
na odchylenie będzie u; — a. 

. Dla przeprowadzenia dowodu weźmiemy zasadnicze rów- 
nanie 


n 
nu = Xu,, 
Ostatnia forma równania jest matematycznym wyrazem oma- 
wianej własności średniej arytmetycznej. 

Tylko średnia arytmetyczna ma taką własność. Suma l- 
gebraiczna odchyleń od każdej innej liczby nie jest równa 
zeru. W istocie, niech będzie a jakakolwiek liczba. Będziemy 
mieli 


n s ę n CZAR 
Y (u. (u—utu—a)=Yfu—u'+Y(u— a), 
i z i P 


Pierwsza z otrzymanych dwóch sum jest sumą odchyleń od 
średniej i przeto równa zeru. Druga zaś równa się n (u —a). 
Wobec tego otrzymamy równanie 


Bor y R 
Xu ak" nlus= al 
1 


które jest dowodem rozpatrywanego twierdzenia. f 
Z powyższego równania można dla średniej arytmetycz- 
nej otrzymać wzór: i 
n 
X (u; — a) 


(3) 


n 


który jest podstawą metody wartości wyjściowej dla oblicza- 
nia tej charakterystyki. W nim a jest wartością wyjściowa. 


EATS N O 
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Tę wielkość można obrać dowolnie. Dla uproszczenia bierze 
się liczbę całkowitą pośrednią między wartościami wariantów. 
Wtedy w obliczeniach będziemy mieli do czynienia z liczbami 
stosunkowo małymi. 

Metody wartości wyjściowej można używać przy każdej 
formie materiału statystycznego. Najważniejsze jest jednak 
jej zastosowanie do szeregów rozdzielczych. Wtedy wy- 
biera się jako wartość wyjściową najczęstszą 
wartość wariantów, przez co liczne odchyle- 
nia staną sięrówne zeru. 

Głównym zadaniem jest teraz obliczenie sumy odchyleń 


n 


wariantów od wartości wyjściowej czyli sumy X (u, — a) 
1 
w równaniu (3). Będzie ona równa sumie 


l 
fia m aE ama) E alaa H a) = Ę f, (c, — a) 


i równanie (3) przybierze formę: 


l 
3 fi (x, — a) 


ZLA" 


Sf, 
1 


W nim ostatni wyraz przyjęto oznaczać przez b: 


Dodawanie wielkości b do wartości wyjściowej daje śre- 
dnią arytmetyczną : u =a + b. 

Obliczanie średniej arytmetrycznej dla szeregu rozdziel- 
czego należy przeprowadzać według schematu, który pokażę 
na przykładzie liczby kwiatów w koszykach sałatnicy (tab. 6,2). 


Zasady i metody statystyki 4 
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Obieramy jako wartość wyjściową wartość modalną 17. Otrzy - 
mamy wtedy (tab. 10,1) 


Tabela 10,1 


Liczby kwiatów w koszykach sałatnicy 


uj z—a f (c — a) 


= 


427 — 327 : 
Wielkość b wypadnie równa BE "WE a a średnia 


arytmetyczna m=u=a + b=17 + 0.279 = 17.279. Wystarczy 
wziąć cztery cyfry i przyjąć m = 17.28. 


W podobny sposób przeprowadza się obliczenia dla sze- 
regów rozdzielczych z wariantami zgrupowanymi w klasy. 
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Traktuje się wtedy materiał statystyczny, 
jak gdyby warianty każdej klasy miały jed- 
nakową wartość, równą numerowi danej 
klasy. Numery te, będące nową formą zmiennej ewentual- 
nej, oznacza się dla odróżnienia od wartości pierwotnej zmien- 
nej ewentualnej symbolem x’ zamiast x i operuje się nimi zu- 
pełnie tak samo jak poprzednio z niezmienionymi wartościami 
wariantów. Tak samo częstości klas oznacza się przez f. 

Wyniki otrzymuje się wyrażone w szerokości klas jako 
jednostce pomiarowej. Nie są one ostateczne. Dla oznaczenia 
ich używa się tych samych symbolów co poprzednio, ale z do- 
daniem u góry przecinka, tak samo, jak dla oznaczenia nowej 
formy zmiennej ewentualnej, a więc przez b’ zamiast b, m 
zamiast m. Ostateczne wyniki otrzymuje się, mnożąc tymcza- 
sowe przez szerokość klas. 

Tytułem przykładu obliczymy średnią arytmetyczną liczby 
kwiatów w szczytowych koszykach bławatka z Zimnej Wody. 
Weźmiemy do tego zadania z ust. 5 wszystkie trzy formy (4), 
(5) i (6) materiału zgrupowanego po trzy wartości wariantów. 
Zrobimy to dlatego, żeby wykazać wpływ różnego grupowania 
na wynik obliczeń. Wyniki bowiem są obciążone błędami, gdyż 
warianty zawarte w tej samej klasie mają częściowo różne 
wartości. Błędy te są nieuniknione i nieraz bardzo przykre. 
Chcąc ich uniknąć, trzeba oprzeć się na pierwotnym materiale, 
co pociąga za sobą wielkie utrudnienie w rachunkach. Korzyści, 
które się osiągnie, są zwykle zbyt małe, by warto było sobie 
ten trud zadawać. Trzeba jednak zawsze zdawać sobie sprawę 
z wielkości błędów powodowanych przez grupowanie warian- 
tów. Właśnie dla zobrazowania tego zagadnienia przerobimy 
wszystkie trzy formy naszego szeregu i nadto porównamy 
otrzymane przybliżone wyniki z dokładnymi, wyprowadzony- 
mi z pierwotnej (2) formy szeregu. 


Dla pierwszej formy szeregu obieramy jako wartość wyj- 
Ściową z, dla najliczniejszej (modalnej) klasy 31—33, a więc 
a=10%3. Otrzymamy wyniki zestawione w tabeli 10,2. 


N 
Tabela 10,2 


Liczby kwiatów w koszykach bławatka. Pierwszy sposób 
grupowania. 


Zakresy klas Wartości £! x— a f(x — a) 
środkowe 


Baj 


€ 


8 
zj 
0 
+1 
+2 
+3 
A 
+5 
+6 
+7 
+8 
+9 
20 35 + 10 10 


300 + 378 


m 


co 
NAN 
w" w" W ag~ 


~- 


© D 
~N 
o 


€ 36 
37 — 39 
40 — 42 
43 — 45 
46 — 48 
49 —51 
52 — 54 
55—57 
58 — 60 
61 — 63 


N WW 18 19 13 
WS WS W W- 


e 
; 


DES e a DO Ł « 


~] È 


% 


OTO TOO A 
© 9 


= 
Do 


28 f 
Otrzymujemy b= += + 0,937 i m=10*/, + 0,937 = 
= 10.667 -- 0.987 = 11.604 w przedziałach klasowych. Ostatecz- 
nie wypada: m=3 X 11.604 = 34.812. Można przyjąć m = 34.81. 
Dla drugiej formy szeregu, biorąc a= 11, otrzymamy na- 
137 
stępujące wyniki (tab. 10,3): b’ = Ta = + 0,623, m = 11 + 
+i 0;623 = 11,623, zatem m = 34,869. Można wziąć m = 34,87. 
Wreszcie trzecia forma szeregu da nam przy a= 11 '/ 
(tab. 10,4): b’ = + 007 = 0.235, m= 11], 0.288 
— 11.333 + 0.243 =11.576. Stąd m = 34.728. Można przyjąć 
m =34.73. . 
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Obliczając dokładną wartość Średniej arytmetycznej na 
podstawie szeregu (2) ust. 5, otrzymuje się liczbę 34.77. Zesta- 
wiając ją z przybliżonymi wynikami, znajdziemy błędy: dla 
pierwszej formy szeregu + 0.40, dla drugiej + 0.10, dla trze- 
ciej — 0.04. Najlepiej wypadły wyniki dla pierwszej i trzeciej 
formy szeregu. Pochodzi to stąd, że w pierwszej formie szeregu 
częstości zgrupowały się najbardziej w środkach klas, a trzecia 
forma jest najlepiej wyrównana. Różnice są zresztą wszystkie 
niewielkie. Tak jest zawsze dla szeregów mniej więcej syme- 
trycznych, takich jak rozpatrywany szereg bławatka, bo wtedy 
błędy pochodzące od mniejszych wariantów równoważą się 
mniej więcej przez błędy od większych. Dla szeregów bardzo 
skośnych i jednobocznych błędy mogą wypaść duże. 


Tabela 10,3 


Liczby kwiatów w koszykach bławatka. 
Drugi sposób grupowania. 

Zakresy Wartości x’ TOETA f'(x — a) 
klas środkowe 

20—22 

23—25 

26—28 

39—31 

32—34 

35—37 

38—40 

41—43 

44—46 

47—49 

50—52 

53—55 

56—58 

59—61 

62—64 


Tabela 10,4 


Liczby kwiatów w koszykach bławatka. 
Trzeci sposób grupowania. 
Zakresy Wartości œ’ f x'—a f(x—a) 
klas środkowe 
21—23 22 TY3 
24—26 25 81⁄3 
27—29 28 91 
30—32 31 10%3 
33—33 34 1173 
36—18 37 1273 
39—41 40 13%3 
42—44 43 1473 
45—47 46 15% 
48—50 49 16%3 
51—53 52 i7 
54—56 55 18%3 
57—59 58 1973 
60—62 61 2073 
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Dla lepszego wyjaśnienia metody obliczeń średniej aryt- 
metycznej przytaczam jeszcze jeden przykład szeregu zgrupo- 
wanego, mianowicie szereg otrzymany z pomiarów wagi doro- 
słych Anglików (tabl. 6,3). Znaczenie tego przykładu polega 
na dokładnym wyjaśnieniu pojęcia wartości Środkowej. Szero- 
kość klas jest tu, tak jak to się często robi przy pomiarach, 
równa 10 i początkowe wartości wariantów w klasach są wie- 
lokrotne 10. Zdawałoby się, że wartości środkowe powinny być 
wielokrotne 5. Otóż tak nie jest. Łatwo jest przekonać się, że 
będą one ułamkowe, fikcyjne — zakończone cyframi 4.5, na- 
przykład dla klasy 90—99 wartość środkowa nie będzie 95, 
lecz 94.5. 


Tabela 10,5 


Waga dorosłych Anglików. 


, 


Podziały Wartości x f x'—a f'(x'— a); 
klasowe środkowe 

90 — 99 94,5 9,45 — 10 
100 — 109 104,5 10,45 34 — 136 
110 — 119 114,5 11,45 152 3 — 456 
120 — 129 124,5 12,45 390 — 780 
130 — 139 134,5 13,45 867 — 867 
140 — 149 144,5 14,45 1623 — 2249 
150 — 159 154,5 15,45 1559 1559 
160 — 169 164,5 16,45 1326 2652 
170 — 179 174,5 17,45 187 2361 
180 — 189 184,5 18,45 476 1904 
190 — 199 194,5 19,45 263 1315 
_200 — 209 204,5 20,45 107 642 
210 — 219 214,5 21,45 85 | 595 
220 — 229 224,5 22,45 41 328 
230 — 239 234,5 3,4: 16 i 144 
240 — 249 244,5 24,45 11 I 110 
250 — 259 254,5 25,45 8 38 
260 — 269 204,5 26 1 - 14 12 
270 — 279 274,5 27,45 0 r 18 0 
280 — 289 284,5 28,4: 1 - 1: 14 
1749 -+ 11724 


OR | 


++++++ 
POLO 


m 


14 94:75 
Wypada zatem (tabl. 10.5) b =-+. aie 


m = 14.5 + 1.223 = 14.673, skąd m = 146.7. 


= -F 1.223, 


Jeszcze jedną rzecz trzeba podać o Średniej arytmetycznej. 
Poznaliśmy już jej podstawową własność, że suma algebraiczna 
odchyleń wariantów od niej jest równa zeru. Otóż posiada 
ona jeszcze jedną ważną własność: suma kwadratów od- 
chyleń od średniej arytmetycznej jest mniej- 
sza od każdej innej liczby. Istotnie niech będzie 


§ 10 


a dowolna liczba. Suma kwadratów odchyleń od niej będzie 


n 
Z (u; — a). Wstawmy do tego wzoru a =u — b, gdzie b jest 
1 


znaną już nam wielkością. Będziemy mieli: 


n n z n 
= 2 (u, —u; + b)” = Z (a uszu)” FZ 2b(u, — u) +. 
1 1 i 


T n n 
5 (u, — u)? + 2b2 (u, — u) + nb* 
3 1 


W otrzymanym trójmianie drugi wyraz zawiera jako czynnik 
sumę odchyleń od średniej, będzie zatem równy zeru. Osta- 
tecznie wypadnie równanie 


n n 
X (u, a)? = Z (u, — wnb, 
1 1 


które stanowi dowód omawianej własności średniej arytme- 
tycznej. 

Przechodzimy wreszcie do średniej geometrycznej. Śre d- 
nia geometryczna danych wielkości jest 
pierwiastkiem z iloczynu tych wielkości. 
Stopień tego pierwiastka równa się ich licz- 


bie. W ten sposób średnia geometryczna wielkości a i b jest 
2 3 
V ab, Średnia geometryczna wielkości a, b i c jest |/ abc itd. 


Średnia geometryczna ma mniejsze znaczenie od średniej 
arytmetycznej, ale czasem jest niezbędna, mianowicie wtedy, 
kiedy jakiś stan rzeczy trzeba scharakteryzować za pomocą 
jednej liczby na podstawie dwóch albo kilku różnych cech. 
Naprzykład gdybyśmy chcieli scharakteryzować wartość kłę- 
bów ziemniaczanych na podstawie ich wielkości i zawartości 
„skrobii, to średnia arytmetyczna nie mogłaby być użytą, gdyż 
dodawać można tylko wielkości tego samego rodzaju. Nato- 
miast nic nie stoi na przeszkodzie wziąć średnią geometryczną 
z wagi i zawartość w nich skrobii. Podobnie .„.dorodność ludzi 
możnaby scharakteryzować przez średnią geometryczną z ich 
wagi i wzrostu. Z tego rodzaju średniej zrobimy użytek 
w ust. 40 przy omawianiu charakterystyk korelacji. 
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Dodatkowo trzeba wspomnieć o tym, że czasem — bardzo 
rzadko — używany jest jeszcze jeden rodzaj średnich — Śr e- 
dnia harmoniczna. Nie ma ona poważniejszego znacze- 
nia i omawiać jej nie będę. 

11. Pojęcie momentów. Średnia arytmetyczna, mimo pod- 
stawowego jej znączenia, nie wystarcza do scharakteryzowania 
materiału statystycznego. Stanowi ona pewnego rodzaju ośro- 
dek w zbiorze wariantów, nie .określa jednak, jak są one w nim 
rozmieszczone. Do tego są potrzebne odchylenia wariantów 
od niej, z którymi już mieliśmy do czynienia w poprzednim 
ustępie. Ponieważ odchylenia są różne, trzeba ich zbiór scha- 
rakteryżować za pomocą odpowiednich wielkości. Jest rzeczą 
zupełnie naturalną wziąć w tym celu ich średnią arytmetyczną. 
Jest to jednak niewystarczające. i 

Spotkamy się przede wszystkim z trudnością wynikającą 
z natury odchyleń w średniej arytmetycznej: ich suma alge- 
braiczna jest zawsze równa zeru i średnia przeto także równa 
się zeru. Można temu coprawda zaradzić, traktując osobno od- 
chylenia dodatnie i ujemne albo biorąc ich wartości absolutne. 
Główna rzecz jest jednak w czym innym: różne zbiory 
liczb mogą dać tę samą średią arytmetyczną. 
Przeto średnia arytmetyczna odchyleń od średniej, gdyby się 
nawet nie równała zeru, nie wystarcza dla charakterystyki ich 
zbioru, bo może się znaleźć inny materiał, który da dla zbioru 
odchyleń od Średniej taką samą Średnią. Trzeba wobec tego 
wyszukać inne jeszcze charakterystyki tego zbioru, któreby 
były różne dla różnych materiałów. 


Dla rozwiązania takiego zagadnienia niema innego Środka, 
jak użycie obok odchyleń jeszcze ich potęg: kwadratów, sze- 
ścianów itd. .Naturalnie dla otrzymanych tą drogą zbiorów 
trzeba będzie znowu obliczać średnie arytmetyczne. W ten 
sposób dochodzimy do pojęcia momentów. 


Momentem k -ego stopnia względem jakiejś 


wielkości a nazywamy średnią arytmetyczną 
k-ych potęg odchyleń wariantów od tej wiel- 
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kości. Z tego określenia wyprowadzamy ogólny wzór dla 
momentów 


n k 
X (u, — a) 
1 


B, = —— —— 


T n 


(1) 


Z tego rodzaju wielkościami już mieliśmy do czynienia 
przy obliczaniu średniej arytmetycznej. I tak wielkość b, 
która tam występowała, fest niczym innym jak momentem 
pierwszego stopnia względem wartości wyjściowej 1 można 
napisać: 


z 
X (u, — a) 
1 


b= 
n 
Sama Średnia arytmetyczna jest momentem pierwszego sto- 
pnia a mianowicie względem zera: 


ke 
X (u, — a) 
m= -= 


n 


Zgodnie z poprzednimi wywodami dla charakterystyki 
materiałów statystycznych weźmiemy momenty względem 
średniej arytmetycznej. Będziemy je nazywali po 
prostu momentami i będziemy oznaczali literą m z od- 
powiednią liczbą wskaźnikową: 


Frzy obliczaniu ich wypadnie posługiwać się momentami 
względem wartości wyjściowej. Będziemy je nazywali 
momentami pomocniczymi i oznaczali literą «m. 
Wielkość b jest pierwszym takim momentem. 

Ile trzeba wziąć momentów dla należytej charakterystyki 
materiału statystycznego? Widzieliśmy, że moment pierwszego 


stopnia nie wystarcza, nawet jeżeli go weźmiemy osobno dla 
dodatnich i ujemnych odchyleń. Trzeba do niego dodać mo- 
ment drugiego stopnia. Charakterystyka materiału będzie 
lepsza, bo jeżeli jest dużo różnych materiałów o tym samym 
momencie pierwszego stopnia, to jest mniej takich, co mają te 
same momenty i pierwszego i drugiego sopnia. Jeszcze mniej 
będzie takich, co mają te same momenty pierwszego, drugiego 
i trzeciego stopnia itd. 

Jak daleko należy iść tą drogą? Oczywiście nie za daleko, 
bo wtedy dla charakterystyki zbioru liczb, jakim jest materiał 
statystyczny, mielibyśmy nowy zbiór innych liczb, który też 
wymagałby charakterystyki. Niektórzy badacze, szczególnie 
meteorologowie, zadowalają się momentem pierwszego sto- 
pnia, odpowiednio zmienionym, tak żeby nie równał się zawsze 
zeru. Większość zatrzymuje się na momencie drugiego stopnia. 
Mniej liczni idą dalej. Poza czwarty stopień iść nie warto, bo 
jak to zobaczymy w dalszym ciągu, za pomocą pierwszych 
czterech momentów można dostatecznie dokładnie scharakte- 
ryzować każdy materiał statystyczny. 


12. Monienty pierwszego stopnia. Są one, jak to widzieliśmy 
w ust. 10 i 11, równe zeru dla każdego materiału. Nie jednak 
nie stoi na przeszkodzie, by obliczyć taki moment osobno dla 
wariantów mniejszych od średniej i osobno dla wariantów 
większych do niej. Warianty mniejsze od średniej 
noszą nazwę minus wariantów, większeodniej 
— nazwę plus wariantów. Te nazwy często używane 
i wygodne mają niestety tę wadę, że używa się ich także w in- 
nym znaczeniu: minus wariantami nazywa się 
nieraz warianty mniejsze od wartości modal- 
nej, plus wariantami — warianty większe od 
niej. 

Z powyższego wynika, że wypada rozpatrywać dwa czę- 
ściowe momenty pierwszego stopnia. Pierwszy 
z nich obliczony dla minus wariantów jest ujemny, drugi zaś 
obliczony dla plus wariantów jest dodatni. Dla obliczenia 
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trzeba najpierw podzielić szereg rozdzielczy na dwie części. 
Przypuśćmy, że pierwsza część — złożona z minus warian- 
tów — obejmuje wyrązy szeregu od 1 do k z n, wariantami, 
druga zaś — złożona z plus wariantów — wyrazy od k +1 
do n z n, wariantami. 

Dla pierwszego częściowego momentu pierwszego stopnia, 
który oznaczamy symbolem m.;, będziemy mieli wzór: 


a e a E E 
Wstawiamy do niego u=a +.b, gdzie a i b są znanymi 
już nam wielkościami. Wstawiamy nadto: f, + fa t.. tf = 
= n,. Otrzymamy 
fil — a — b) + fs (x, — a —b) +. . + f, (2, —a— b) _ 


Mı = - 


n 


i 
Aj — a) —b(f, >+... +7) 


ny 


X (x, — a) — n,b 
1 


ny 


Dla drugiego częściowego momentu pierwszego stopnia, 
który oznaczymy symbolem Mı, w podobny sposób wypro- 


'wadzimy wzór: 


k 
1 f,(x, — a) — nb 
k+1 


Mis = 

Na 
Za pomocą -powyższych wzorów można przeprowadzać 
obliczenia tych momentów metodą wartości wyjściowej. Przy 
tym trzeba mieć na uwadze, że licznik w równaniu (1) jest ab- 
solutną wartością sumy ujemnych odchyleń od średniej, a licz- 


nik w równaniu (2) jest sumą dodatnich odchyleń. Ponieważ 
'suma algebraiczna wszystkich takich: odchyleń jest równa 


zeru, oba liczniki powinny być sobie równe. Ewentualne róż- 
nice pochodzą z odrzucania dalszych znaków dziesiętnych. 

Zastosujemy te wzory do liczby kwiatów w koszykach sa- 
łatnicy. Będziemy tu mogli skorzystać z rachunków ust. 10. 
Minus warianty będą miały wartości od 11 do 17, plus wa- 
rianty — od 18 do 25. Pierwszych jest 195, drugich 164. Weż- 
miemy tę samą wartość wyjściową .a = 17. Otrzymamy: 
"PARE 827 + 195 X 0,279 827-544 _ 381,4 2 

z. 195 195 


= 00 
, 427 — 164 X 0,279 1427 — 45,8 sn 
i r i -= J ; Ą 

164 164 


Mi: = 


W podobny sposób przeprowadza się obliczenia dla mate- 
riałów zgrupowanych w klasy. Dla trzech form szeregu roz- 
dzielczego liczby kwiatów w koszykach bławatka będziemy 
mieli wartości (tab. 12,1). W tej tabeli są podane wartości mo- 
mentów w przedziałach klasowych, oznaczone symbolami m 
i m», Oraz ostateczne ich wartości otrzymane przez pomno- 
żenie przez szerokość klas, to znaczy przez trzy. Dokładne 
wartości są M;, = —4,473 i Myę = 14.782. 


Tabela 12,1 


Momenty pierwszego stopnia dla trzech form zgrupowanego. 
szeregu liczby kwiatów w koszykach bławatka. 


Formy szeregu 


Momóńty | 0L 


$ 12, 13 


Błędy powodowane przez grupowanie wypadły tu daleko 
większe niż dla średniej artymetycznej. Nie jest to wcale 
dziwne wobec tego, że przy obliczaniu momentów pierwszega 
stopnia błędy pochodzące od minus i plus wariantów nie rów: 
noważą się. 

Momenty pierwszego stopnia są bardzo cenne, gdyż dają 
wymiar odchyleń wariantów od średniej, określają stopień 
rozsiewu wariantów, jak się to mówi. 


13. Momenty drugiego stopnia. Są one oczywiście zawsze 
dodatnie. Obliczenie ich można oprzeć na równaniu, wypro- 
wadzonym w końcu ust. 10. Napiszmy je w formie 


» (u, — u)” == A ia) — nb” 


Wystarczy to równanie podzielić przez n, by otrzymać od- 
nośny podstawowy wzór 


a 
2 (u, — a)” 
m, = — — b’? 
n 


Przez wprowadzenia pojęcia pomocniczych momentów wzglę- 
dem wartości wyjściowej powyższy wzór przyjmie formę: 
Ma = Hz — M 


Dla szeregów rozdzielczych pomocniczy moment m; oblicza się 
na podstawie wzoru: 


n 
> f (&; 2) a) 


P = 


n 


Obliczenie przeprowadza się według schematu, który przed- 
stawię dla liczb kwiatów w koszykach sałatnicy (tab. 13,1). Zo- 
stała wzięta ta sama wartość a = 17. 


Tabela 13,1 
Liczby kwiatów w koszykach sałatnicy 


(c—a) f(x— a) 
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Otrzymujemy p, = en = 6.852, m, = 6.852 — 0.279? = 


= 6.852 — 0.078 = 6.774. 


Z materiałem zgrupowanym w klasy obliczenia prowadzi 
się tak samo, traktując numery klas jako wartości wariantów. 
Otrzymany prowizoryczny wynik mnoży się przez kwadrat 
szerokości klas. Weźmiemy znowu materiał bławatka. Obli- 
czenia przeprowadzimy osobno dla wszystkich trzech form 
grupowania i dla materiału niegrupowanego, tak samo jak to 
zrobiliśmy dla średniej arytmetycznej. 


Dla pierwszej formy szeregu (tab. 13,2) otrzymujemy przy 
i 4,667, M’, = 4.697 — 0.937* = 4.697 — 
— 0.878 = 3.819. 


a 


Mnożąc przez kwadrat szerokości klas, otrzymamy ostatecznie 
My = 34.371. Można przyjąć m. = 34.37. 
Tabela 13,2 


Liczby kwiatów w koszykach bławątka 
Pierwszy sposób grupowania. 


Zakresy klas A J: (c —a) f(x —a) 
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Poprawki i uzupełnienia 


Strona: Wiersz: Zamiast: 


S fixi — a) 


16 od góry u= a+ = 


13 
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Dla drugiej formy szeregu przy a= 11 wypada: 

REA = 4.383, m, = 4.383 — 0.623*— 4.383 —0.388— .995, 
m, = 9 X 3.995 = 35.995. Można przyjąć m, = 35.99. Szczegółów 
obliczeń dla tej formy i dla trzeciej nie podaję, pozostawiając 
czytelnikowi przeprowadzenie rachunków. ' 

Wreszcie dla trzeciej formy szeregu przy a= 11'/: wypada: 
W, = = 4.017, m, = 4.017 —0.243* — 4.017 — 0.059 = 3.958. 
Stąd m. = 35.622. Można przyjąć me = 35.62. 

Niegrupowana forma omawianego materiału daje m,= 
= 384.704. Wobec tego pierwsza forma szeregu dałą wynik za 
mały, dwie pozostałe — za duży. Różnice wynoszą kolejno: 
— 0.33, +: 1,29, + 0.92. Są one większe niż dla średniej arytme- 
tycznej, bo błędy pochodzące z minus i plus wariantów nie 
równoważą się. 

Angielski statystyk Sheppard zaproponował użycie 
poprawki, która częściowo wyrównuje błędy, jakie występują 
przy obliczeniu momentu drugiego stopnia skutkiem grupowa- 
nia wariantów. Wynik wypada mianowicie z reguły za duży. 


1 
5 A, gdzie 4 


Poprawkę przeto odejmuje się. Wynosi ona — 


jest szerokością klas. Ta poprawka nie zawsze poprawia wy- 
nik. Warunkiem powodzenia jest przede wszystkim stopnio- 
wość w zmianach częstości w przejściu od jednego wyrazu do 
drugiego w pierwotnej formie szeregu. Następnie forma sze- 
regu powinna być nietylko symetryczna, ale jeszcze zbliżona 
do normalnej krzywej prawdopodobieństwa, o której będzie 
mowa w ust. 25. ; 

W naszym przykładzie mamy szereg nie odbiegający zbyt- 
nio od normalnej krzywej prawdopodobieństwa, ale pierwotna 
jego forma wykazuje silne przeskoki w częstościach. To też 
poprawką Shepparda do pierwszej formy szeregu nie da 
się wogóle zastosować, bo wynik i tak wypadł za mały. Drobne 
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wyrównanie otrzymuje się tylko dla trzeciej formy szeregu, 
dla której po wprowadzeniu poprawki wypada wartość mo- 
mentu równa 34.87. 


Trzecia forma szeregu bławatka, ogólnie biorąc, wypada 
więc najlepsza, bo i średnia arytmetyczna była bliska prawdzi- 
wej. Była to forma szeregu najlepiej wyrównana. Można przy- 
jać zatem za prawidło ogólne, by wybierać formy szeregów 
możliwie najbardziej wyrównane. Można zalecić stosowanie 
do nich poprawki Shepparda, trzeba jednak zawsze mieć 
na uwadze podane powyżej zastrzeżenia. 


Momenty drugiego stopnia mają większe znaczenie od 
wszystkich innych, a mianowicie o tyle, że oprócz charaktery- 
styki materiału statystycznego, mającego prawie zawsze cha- 
rakter próby, odgrywają one poważną rolę przy ocenie stop- 
nia, w jakim dana próba charakteryzuje całość populacji. Bę- 
dzie o tym mowa w rozdziale V. 


14. Momenty trzeciego stopnia. Wstawiając do zasadniczego 
wzoru 


n 

kz y 
+ (u, — u) 
my SE >> 

n 

u=a +b, otrzymujemy wzór roboczy dla tego rodzaju mo- 
mentów 


n n n 
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Widzimy, że do obliczenia momentu trzeciego stopnia trze- 
ba oprócz pomocniczego momentu m; obliczyć jeszcze dwa po- 
przednie momenty tego rodzaju: M i Mo. 


Tabela 14,1 
Liczby kwiatów w koszykach sałatnicy. 
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Dla szeregów rozdzielczych mamy wzór na pomocniczy mo- 
ment uz: 
l 
Ma = J fi Bray 
p 1 n 


Według tego wzoru możemy tytułem przykładu przepro- 
wadzić obliczenia dla liczby kwiatów w koszykach sałatnicy 
3 2884 a 
(tab. 14,1). Otrzymamy m; = + > = + 8.034. 
59: 
Poprzednio otrzymaliśmy: 


Kı = 0.279 i u. = 6.852. Wypadnie więc 3u,us = 5.735 i 24 = 
==0.044. Ostateczny wynik będzie: 


m, A + 8.084 — 5.735 + 0.044 = 2.343. 


§ 14 


Jeżeli warianty są zgrupowane w klasy, obliczenia prze- 
prowadza się z początku tak samo. Potem mnoży się wynik 
przez trzecią potęgę szerokości klas. Jako przykład weźmie- 
my materiał bławatka zgrupowany trzecim sposobem (tab. 
14,2). Ta forma szeregu wypadła bowiem najlepsza. Otrzymamy: 

pa = Z" = + 8.328. 
300 

Poprzednio mieliśmy: u, = + 0.248, #’,= 4.017. Wobec tego 
m’, = 8.323 — 3 X 0.243 X 4.017 + 2 X 0.243 ==8.323 — 2.928 + 
0.029= + 5.424. Ten wynik jest wyrażony w przedziałach 
klasowych. Mnożąc go przez sześcian szerokości klas, to zna- 
czy przez 27, otrzymamy ostatecznie m; = 146.448. Można 
przyjąć: m; = 146.4. 


Tabela 14,2 
Liczba kwiatów w koszykach bławatka. 


Trzecia forma szeregu. 
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Dla tego materiału zgrupowanego pierwszym i drugim 
sposobem otrzymamy dla momentu trzeciego stopnia wartości 
140.9 i 136.5. Przeprowadzenie rachunków pozostawiam czytel- 
nikowi. Dokładna wartość wynosi m, = 149.4. Widzimy, że 
i w tym przypadku trzeci sposób grupowania jest najlepszy. 
Przy obliczaniu momentów trzeciego stopnia błędy wynikające 
z grupowania nie powinny być duże, gdyż wpływy minus i plus 
wariantów częściowo znoszą się. W naszym przykładzie te 
błędy są jednak znaczne, co wypływa z charakteru materiału, 
przez silne przeskoki w częstościach w pierwotnej jego formie. 
Przyjęte jest przy obliczaniu momentów trzeciego stopnia nie 
stosować żadnej poprawki na grupowanie. 

Momenty trzeciego stopnia mogą mieć wartości dodatnie 
i ujemne. Stoi to w związku z charakterem skośności. Szeregi 
zupełnie symetryczne dałyby wartość równą zeru. Wartość 
absolutna wypada tym większa, im szereg jest bardziej skośny. 


15. Momenty czwartego stopnia. Dla obliczenia tych mo- 
mentów wstawiamy, jak zwykle, do wzoru zasadniczego 
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Dla szeregów rozdzielczych mamy wzór roboczy: 
l 
A N JA 
e fi (x; — a) 
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Według niego tytułem przykładu obliczymy moment 
czwartego stopnia dla liczby kwiatów w koszykach. sałatnicy 
(tab. 15,1). 


Tabela 15,1 
Liczba kwiatów w koszykach sałatnicy. 
x j (x — a)* f (c—a)* 
11 2 1296 2592 
12 7 625 4375 
13 16 256 4096 
14 29 81 ` 2349 
15 42 16 672 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 


Będziemy mieli 


24, 20309; 


= 128,99 


ką — 


300 
Poprzednio otrzymaliśmy: m, = b= 0.279 m, = 6.852 ms = 8.034, 
Wobec tego otrzymamy: 
m, = 128.99 — 4 X 0.279 X 8.034 + 6 X 0.279* X 6.852 — 
— 3 X 0.279* = 128.99 — 8.95 +! 3.19 — 0.02 = 123.2. 


Obliczanie momentów czwartego stopnia dla materiałów 
zgrupowanych w klasy przeprowadza się tak samo, traktując 
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numery klas jako wartości wariantów. Wynik otrzymuje się 
w przedziałach klasowych jako jednostce pomiarowej. Osta- 
teczną wartość otrzymuje się, mnożąc przez czwartą potęgę 
szerokości klas. 

Jako przykład przeprowadzimy rachunki dla bławatka 
według materiału zgrupowanego trzecim sposobem (tab. 15,2). 
Otrzymamy. 

20908: : 1 z A 
TA = 12.98,m', = 66.30. Mnożąc go przez 3‘ = 81 otrzy- 
mujemy m, = 5370. 


Tabela 15,2 
Liczby kwiatów w szczytowych koszykach bławatka. 


Trzecia forma szeregu. 
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Dla pierwszego i drugiego sposobu grupowania wypadają 
wartości 4981 i 5582. Dokładna wartość wynosi 5915. Najlepiej 
wypadła w tym przypadku druga forma grupowania, nie trze- 
cia jak dotąd. Różnice są znaczne, bo niema wyrównania dzia- 

. łaniem plus i minus wariantów. 
Przy obliczaniu momentów czwartego stopnia używa się 


poprawki, która wynosi: 
* 


A! nab 
PUREE L 
gdzie 2 jest -szerokość klas. Poprawkę trzeba odejmować. 
Zastosowanie jej dla trzech form szeregu daje wartości: 4828, 
5423 i 5212. W naszym przypadku poprawka wywołuje po 
gorszenie wyników. 

Momenty czwartego stopnia są naturalnie zawsze dodat- 
nie. Znaczenie ich polega na tym, że określają one, w jakim 
stopniu warianty są skupione przy średniej arytmetycznej. 
Im bardziej warianty są skupione przy średniej, tym mniejszy 
wypada moment czwartego stopnia — mniejszy nie większy, 
jak by się można było spodziewać. 


ms 


ROZDZIAŁ III. 


POCHODNE CHARAKTERYSTYKI MATERIAŁÓW 
STATYSTYCZNYCH. 


16. Wstępne uwagi. W rozdziale II rozpatrzyliśmy pody 
stawowe charakterystyki szeregów rozdzielczych. Trzeba te- 
raz wyzyskać je dla bezpośredniego, można powiedzieć pogla- 
dowego, przedstawienia osobliwości materiałów statystycz- 
nych. 

Najbardziej poglądową charakterystyką materiałów staty- 
stycznych jest wartość modalna, wartość wariantów najczę- 
stsza. Niestety, jak to było wyjaśnione w ust. 9, wyznaczenie 
jej jest możliwe tylko dla obfitych materiałów statystycznych. 

Średnia arytmetyczna jest mniej poglądową charaktery- 
styką. Jeżeli materiał układa się w szereg rozdzielczy mniej 
więcej symetryczny, różni się ona nieznacznie od wartości mo- 
dalnej. Dla szeregów jednobocznych mówi niewiele. Tym nie 
mniej jest to charakterystyka podstawowa, gdyż daje się za- 
wsze ustalić i nadto służy za podstawę do obliczenia innych 
charakterystyk. 

Bardzo cenne są częściowe momenty pierwszego stopnia, 
gdyż dają bezpośredni wyraz rozsiewu wariantów wokół śred- 
niej arytmetycznej. 

Wszystko to jednak nie wystarcza i trzeba wprowadzić 
jeszcze inne charakterystyki. Będą to funkcje charakterystyk 
podstawowych i przeto mogą być nazwane pochodnymi. 


Do rozpatrzenia ich teraz przystąpimy. 
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17. Przeciętne i Średnie odchylenie. Trzeba przede 
wszystkim ustalić charakterystykę, która by dawała obraz 
stopnia zmienności wariantów, obraz stopnia ich rozsiewu. 
Zadanie to spełniają częściowo momenty pierwszego stopnia. 
Jest to jednak niedostateczne o tyle, że jest ich dwa: osobny 
dla minus wariantów, osobny dla plus wariantów. Trzeba mieć 
jeszcze ogólną charakterystykę rozsiewu, wspólną dia wszyst- 
kich wariantów. 

Do tego służyć może przeciętne odchylenie wariantów od 
ich Średniej arytmetycznej, nazywane w skrócie odchyle- 
niem przeciętnym. Jest to Średnia arytme- 
tyczna absolutnych wartości wszystkich 
odchyleń wariantów od średniej arytmetycz- 
nej. Można ją zatem określić przez równanie: 


| Í 
„| jaf | 
[Vi A 


n 


Obliczenie tej wielkości przeprowadza się za pomocą czę- 
ściowych momentów pierwszego stopnia, gdyż jak to widzie- 
liśmy w ust. 12 jeden z nich określa Średnią wielkość odchy- 
leń ujemnych, drugi — dodatnich. Trzeba wziąć średnią 
ważoną ich absolutnych wartości. 


MaRi HF Mys Tę 
nę stonę 


= 


gdzie n, jest liczbą wariantów mniejszych od średniej, n, liczbą 
wariantów większych od niej. Średnia musi być ważona, gdyż 
te częściowe momenty nie są równoważne, reprezentując na 
ogół różne liczby wariantów. 

Zestawiając wzory dla obu momentów, otrzymuje się dla 
wykonania obliczeń równanie: 
39. ja! 
: haa] T fi (x, — a) + (n, + n.)b 


R: 


n 
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Obliczenie łatwo jest przeprowadzić, wyzyskując liczby 
rachunków do obliczenia Średniej arytmetycznej. I tak dla 
liczby kwiatów w koszykach sałatnicy, gdzie jest 195 minus 
wariantów i 164 plus wariantów, będziemy mieli: 


__ 327 +.,427 +'(195—164) X 0.279 _ 
E "359 


3 


327 +:427 + 31 X 0.279 — 762.65 
PA ——— 2 22124 
359 395 


Dla materiałów zgrupowanych rachunki przeprowadza się 
tak samo, operując numerami klas jak wartościami wariantów. 
Ostateczny wynik otrzymuje się, mnożąc przez szerokość klas. 
Dla trzech form materiału bławatka wypadają wartości prze- 
ciętnego odchylenia równe 4.993, 4.731 i 4.665. Dokładna war- 
tość wynosi 4.623. Trzecia forma grupowania daje zatem wynik 
najlepszy, tak jak dla wszystkich innych charakterystyk z wy- 
jątkiem momentu czwartego stopnia. 

„Odchylenie przeciętne jest najlepszym, bo najbardziej 
poglądowym, przedstawieniem wielkości odchyleń od średniej, 
a przeto i zmienności wariantów. Używając tej wielkości, na- 
leży jednocześnie podawać oba częściowe momenty pierwszego 
stopnia, charakteryzujące osobno odchylenia ujemne i dodatnie. 
Jako przykład można podać przeliczenia Smosarskiego/) 
dla średnich dobowych temperatur Poznania w poszczególnych 
miesiącach lat 1848— 1922 (tab. 17,1). Ta tabela zawiera nadto 


d 
średnie arytmetyczne temperatur (m) i wielkości 5i- , o któ- 
rych będzie mowa później. 


Pomimo swoich zalet odchylenie przeciętne rzadko jest 
obliczane. Jedynie meteorologowie korzystają stale z tej wiel- 
kości, przykładem przytoczona praca Smosarskiego. 


1) W. Smosarski. Temperatura i opady w Wielkopolsce. — 
' Prace Komisji Matematyczno - Przyrodniczej Tow. Przyjaciół Nauk 
w Poznaniu. Seria A. Tom 2 (1925). 
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Zwykle dla charakterystyki zmienności wariantów bierze się 
t zw. odchylenie średnie, które jest pierwia- 
stkiem kwadratowym z momentu drugiego 
stopnia: c =V m.. 

Oczywiście ta wielkość nie daje tak dobrego obrazu wiel- 
kości odchyleń, jak odchylenie przeciętne. W niektórych przy- 
padkach daje wręcz złe o tym pojęcie, mianowicie kiedy wa- 
riantów jest mało i trafią się wśród nich niektóre wyjątkowo 
silnie odbiegające od średniej arytmetycznej. Wtedy te ostatnie 
warianty dają wyjątkowo duże odchylenia, które będąc pod- 
niesione do kwadratu przy obliczeniu średniego odchylenia 
wpływają nadmiernie na jego wartość. Przy obfitych materia- 
łach tak źle nie jest, bo wprawdzie mogą się w nich trafić ta- 
kie wyjątkowe warianty, ale ich liczba w stosunku do ogólnej 
ilości wariantów nigdy nie jest duża. 

Jeżeli pomimo swojej mniejszej poglądowości średnie od- 
chylenie jest powszechnie używane zamiast przeciętnego, tłu- 
maczy się to głównie tym, że przeciętne odchylenie poza przed- 
stawieniem rozsiewu wariantów nie znajduje żadnego prawie 
innegó zastosowania, podczas gdy odchylenie średnie znajduje 
bardzo ważne zastosowanie w ocenie wiarogodności charakte- 
rystyk. Jak to będzie dokładniej objaśnione w rozdziale V, 
materiały statystyczne prawie zawsze są próbami wziętymi 
z jakiejś populacji. Przeto obliczone na ich podstawie charakte- 
rystyki tylko w przybliżeniu określają osobliwości populacji. 
Określenie, w jakim stopniu to czynią, wymaga znajomości 
średniego odchylenia. 

Ta okoliczność jeszcze nie wystarczyłaby do porzucenia 
przeciętnego odchylenia, ale do tego dochodzi jeszcze ta właści- 
wość obu omawianych odchyleń, że stosunek między nimi jest 
mało zmienny. Jak to widać z tablicy 17,1, odchylenie przecięt- 
ne jest mniejsze od średniego, ale stosunek jednego do drugiego 
waha się dla odnośnego materiału w granicach od 0.755 do 
0.858. W innych przypadkach jest mniej więcej tak samo. 
W ten sposób, mając tylko odchylenie średnie, można mieć 
przybliżone pojęcie o rozsiewie wariantów. 


Tabela 7,1 


Średnia dobowa temperatur powietrza w Poznaniu 
dla poszczególnych miesięcy i lat okresu 1848 — 1922. 


| —06 | 82 
--2.53 |274 | |-1:42 |-1.41 |--1.21 | = —2.34 |--0.62 
213 | 1.86 | 39 |bnaa | „1. | 1.36 | 0.58 
2.32 | 2.22 | | 1. ; 2.06 | 0.60 
3.01 | 2,94 | 2.32 | E75 |-1.77 | 15 253 | 0.70 


0.770 | ; .800 | 0. À 0.814 | 0.790 
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Do tego dochodzi jeszcze jedno: odchylenie przeciętne, 
lepiej charakteryzując poszczególne próby, nieco gorzej od 
średniego charakteryzuje populacie, z której próby były 
wzięte. (por. ust. 30). Wreszcie wzór dla średniego odchylenia 
jest prostszy niż dla przeciętnego. 

Dla omawianych stale przykładów sałathicy i bławatka 
średnie odchylenie wynosi: dla pierwszego z tych materiałów 
o = p 6.774 = 2.603, dla drugiego użytego bez grupowania 


o = |/ 34.70 = 5.891. Sposób grupowania wpływa naturalnie 


na otrzymywany wynik. Dla trzech form szeregu bławatka ma- 
my wartości V 33.621 = 5.798, | 35.245 = 5.937 il 34.872 = 
= 5.905. 


Stosunek odchylenia przeciętnego do średniego wypada 
dla sałatnicy 0.815 a dla bławatka 0.785. Są to liczby, które 
mieszczą się w granicach wartości, jakie dał materiał meteoro- 
logiczny Smosarskiego. Dla szeregów rozdzielczych formy 
normalnej, której istota będzie wyjaśniona w ust. 25, ten sto- 


N 


sunek równa się y -= 0.798. Jest to tzw. wzór Cornu. 


Warto jest jeszcze poświęcić trochę uwagi nazwom oma- 
wianych w tym ustępie charakterystyk. Panuje tu wielkie za- 
mieszanie. W języku polskim ,„przeciętny” znaczy to samo co 
„Średni”. Należałoby zmienić te terminy. Najlepiej byłoby dla 
uniknięcia nieporozumień nazywać przeciętne odchylenie ..śre- 
dnim liniowym” a średnie „Średnim kwadratowym” tak jak 
to czynią Francuzi (deviation linéaire moyenne et 
quadratique moyenne). W języku angielskich twórców 
współczesnej statystyki tych niejasności niema: tam odchyle- 
nie przeciętne nazywa się mean deviation, średnie zaś 
standart deviation. 
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Na ostatku warto jest zaznaczyć, że rozsiew wariantów 
może być scharakteryzowany bez względu na ich średnią aryt- 
metyczną. Według propozycji jednego z włoskich statystyków 
można do tego celu użyć średniej arytmetycznej absolutnych 
wartości różnie między wariantami, zestawiając je we wszelki 
możliwy sposób. Obliczenie takiej wielkości nie jest zawiłe, 
chociaż mozolne. Wątpliwe jest tylko, czy taka charaktery- 
styka jest lepsza od omówionych w tym rozdziale charakte- 
rystyk zmienności wariantów. 


18. Wskaźnik zmienności. Dla lepszego zobrazowania 
zmienności materiału statystycznego dobrze jest obliczyć 
wskaźnik zmienności Jest to stosunek miary 
odchyleń od średniej arytmetycznej. Stosownie 
do tego, czy się weźmie za taką: miarę odchylenie przeciętne 
czy średnie, będziemy mieli 2 równania: 


© 
dv p G 


m 
Dla liczby kwiatów w koszykach sałatnicy otrzymamy: 


jiii 242 


v 


== = 0.123. ?, 
17.28 


Dla bławatka zaś biorąc dokładne wartości charakterystyk: 
4 9 : F 

RZA =). 1354):7 = 
34.77 -——.34 

Zwykle wyraża się wskaźnik zmienności w procentach, a więc 


dla sałatnicy będą wartości 12.3% i 15.0% a dla bławatka 
13.3% i 16.9%/0. 


Wobec powszechnego użycia odchylenia średniego poda- 
wane w literaturze wartości wskaźnika zmienności prawie 
zawsze odnoszą się do wielkości %, Jako przykład można 


przytoczyć następujące dane co do cech człowieka według źró- 
deł angielskich (tab. 18,1). Mamy tu wartości bardzo różne 


D 


Tabela 18,1 


Wskaźnik zmienności %„ dla cech człowieka w procentach. 


Cechy Mężczyźni Kobiety 


Waga śledzony u zdrowych 38.2 
Waga śledzony u chorych 50.6 
Waga serca u chorych > 38.4 
Waga ciała 10.1 
Siła dłoni 14.1 
Waga mózgu 9.2 9.7 
Wzrost 4.0 4.1 
Obwód czaszki 2.9 2.7 


Przykładów wielkości %5 trzeba szukać u meteorologów. 
Dla przytoczonych w poprzednim ustępie danych Smosar- 
skiego o temperaturze powietrza nie można obliczyć wskaź- 
nika zmienności, chybaby się wzięło temperatury absolutne 
za przykładem Anglików. Ale znajdujemy w tej samej. roz- 
prawie dane o opadach w Poznaniu za ten sam okres 
1848—1922 (tab. 18.2). Mamy tam tylko odchylenia przeciętne 
i obliczone na ich podstawie wskaźniki zmienności dla poszcze- 
gólnych miesięcy i dla całego roku. Warto jest zwrócić uwagę 
na to, o ile mniejszy jest ten wskaźnik dla roku w porównaniu 
do miesięcy. 


19. Wskaźnik skośności. Z kolei trzeba zająć się charak- 
terystyką skośności szeregów rozdzielczych. Jest to zadanie 
dosyć zawiłe i może być rozwiązane w dwojaki sposób. 

Pierwszy sposób opiera się na rozkładzie częstości wzglę- 
dem wyrazu o największej częstości, reprezentującego wartość 
modalną zmiennej ewentualnej. Jeżeli wyrazy jednakowo od- 
legie od wspomnianego wyrazu porównamy ze sobą, ujawnia 
się, że ich częstości prawie zawsze są nierówne. Jeżeli wyrazy 
o większej wartości zmiennej ewentualnej mają częstość więk- 
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szą od wyrazów mniejszej wartości tej zmiennej, uważać mo- 
żna skośność za dodatnią, w przeciwnym razie za ujemną. Tak 
kwestia skośności szeregów rozdzielczych była traktowana do- 
tychczas (por. ust. 6). 

Takie porównania musiałyby dotyczyć wszystkich wyra- 
zów szeregu, co jest niewygodne. Otóż można je zastąpić przez 
jedno tylko porównanie — wartości modalnej ze średnią aryt- 
metyczną. Łatwo jest bowiem zdać sobie sprawę, że przy skoś- 
ności dodatniej średnia jest większa od wartości modalnej, 


Tabela 18,2 
Opady atmosferyczne w Poznaniu w okresie 1848—1922 (w mm) 
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| 36 |508 
16 | 63 


>| 43 | 12 


i 
I 
przy skośności ujemnej natomiast mniejsza od niej. Przy tym 
odchylenie średniej od modalnej jest tym większe, im skośność 
jest silniejsza. W ten sposób powyższe odchylenie można uwa- 
żać za miarę skośności. 

Samo odchylenie od modalnej nie wystarcza jednak dla 
charakterystyki skośności. Trzeba jeszcze wziąć pod uwagę 
rozsiew wariantów. Istotnie dwa szeregi jednakowo skośne, to 
znaczy o jednakowych różnicach częstości w jednakowo od 
modalnej odległych wyrazach wykażą różne odchylenie średniej 
modalnej wartości, jeżeli rozsiew wariantów jest różny: przy 
większym rozsiewie rozpatrywane odchylenie będzie większe, 
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przy mniejszym — mniejsze. Można coprawda rozumować tak 
tylko w odniesieniu do wyrazów szeregu niezbyt daleko odle- 
głych od wartości modalnej, ale to nie zmienia zasadniczo 
"istoty zagadnienia. Wynika z tego rozumowania, że 
aby mieć miarę skośności, trzeba podzielić 
odchylenie średniej od modalnej przez miarę 
rozsiewu wariantów, przez przeciętne albo 
średnie odchylenie. Na tej zasadzie Pearson za- 
proponował jako miarę skośności funkcję: 


4. m — A 


gdzie A jest wartością modalną. Tę funkcję będziemy nazywali 
wskaźnikiem skośności pierwszego rodzaju. 
Dla zobrazowania zagadnienia rozpatrzmy kilka przykła- 
dów. Pierwszym będzie liczba kwiatów w koszykach sałatnicy. 
Dla niej mieliśmy m = 17.279, A = 17, o= 2.603. Wobec tego 
wypada a= +0.107. Jest to słaba skośność dodatnia. 
Następnie weźmiemy liczbę wewnętrznych listków okrywy 
u tej samej rośliny (tab. 6,2). Obliczamy Średnią i średnie od- 
chylenie. Wypada m = 8.1967, o= 0.6094. Ponieważ A=8, 
otrzymujemy a= +0.323. Skośność jest tak samo dodatnia, 
ale silniejsza. 
Wreszcie rozpatrzymy liczbę kwiatów języczkowych 
w szczytowych koszykach Senecio fluviatilis (tab. 6,4). Dla 
niego m = 7.6114, A=8, o= 0.7155. Wobec tego a= —0.543. 
Wskaźnik skośności zgodnie z charakterem szeregu wypadł 
ujemny. $ iy] 
Powyższy sposób ujęcia zagadnienia skośności jest prosty 
i jasny. Niestety, nie zawsze można je tak traktować, gdyż 
wyznaczenie wartości modalnej jest trudne dla szeregów ze 
zgrupowanymi wartościami wariantów i niemożliwe dla mate- 
riałów mało licznych. Dla zaradzenia złemu trzeba szukać innej 
drogi, mianowicie trzeba wziąć za punkt wyjścia moment trze- 
ciego stopnia. Jest on równy zeru dla szeregów dokładnie 
symetrycznych. Dla szeregów skośnych może wiypaść dodatni 
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lub ujemny zależnie od rozkładu częstości. Trzeba przy tym na- 
turalnie wyeliminować, tak samo jak poprzednio, stopień roz- 
siewu wariantów. 

W ten sposób dochodzi się do wskaźnika skoŚśności 
drugiego rodzaju określonego równaniem 


mz 


g? 


Nietrudno jest wykazać, że jest to osobliwego rodzaju mo- 
ment trzeciego stopnia. W istocie wstawiamy w powyższe rów- 
nanie wzór momentu trzeciego stopnia 


n 
1 (u, — u)” 
1 
ULE 
n 
Otrzymamy 
n 3 
X (u; — u)’ 
Sł Gz 
E no 


Ponieważ średnie odchylenie jest wielkością stałą dla danego 
szeregu, można je wprowadzić pod znak sumy: 


T 


Widzimy, że jest to takie same równanie jak powyżej 
przytoczone dla momentu trzeciego, stopnia, tylko wymiar 
wielkości wariantów jest inny: za jednostkę pomiarową jest 
przyjęte średnie odchylenie. Jest to zatem osobliwy moment 
trzeciego stopnia, który można nazwać momentem trze- 
ciego stopnia drugiego rodzaju. 

Zobaczmy, jakie wartości przybiera ten nowy wskaźnik 
skośności w przykładach poprzednio omówionych. Dla liczby 
kwiatów w koszykach sałatnicy mieliśmy m, = +2.343 i przeto 
wypada Y, = +0.133. Dla listków okrywy tej samej rośliny 
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otrzymuje się m; = --0.3900 i zatem 7, = 1.724. Wreszcie dla 
liczby kwiatów języczkowych u Senecio fluviatilis m, = —0.3732 
i 7, =—1.019. 

Otrzymaliśmy wartości odmienne od wartości wskaźnika 
pierwszego rodzaju. Wyjątkowo może się zdarzyć, że nawet 
znak odwrotny. Tak jest dla materiału otrzymanego dla kwia- 
tów języczkowych w szczytowych koszykach syberyjskiej ro- 
śliny Senecio octoglossus w pewnej kulturze Ogrodu Bota- 
nicznego w Dublanach (tab. 19,1). Wypadło tam: m=7.9802, 
o = 0.4445, A = 8, m; =.+ 0.00806. Stąd wynika, że a "—0.445, 

1 = +0.0918. 


Tabela 19,1 


Liczby kwiatów języczkowych w koszykach 
Senecio octoglossus 


Liczby kwiatów: 5 6 7 8 
Ich częstości: 1 207440377 


Te niezgodności między dwoma rodzajami wskaźnika 
skośności pochodzą stąd, że pierwszy z nich określa 
różnice rozsiewu wariantów względem war- 
tości modalnej, drugi zaś względem średniej 
arytmetycznej. Wskaźnik drugiego rodzaju nie daje tak 
jasnego obrazu skośności jak pierwszy, zato można go zawsze 
obliczyć, gdyż wartość modalna jest tu niepotrzebna a mo- 
menty zawsze dadzą się obliczyć. 

Dla materiałów zgrupowanych w klasy wskaźnik drugiego 
rodzaju oblicza się tak samo jak dla materiałów niegrupowa- 
nych. Do tego nie potrzeba ostatecznych wartości charak- 
terystyk m, i o, wystarczą wartości prowizoryczne Mm’, 
io wyrażone w szerokości klas. Przytem przy obliczeniu śre- 
dniego odchylenia trzeba stosować poprawkę Shepparda 


h 1 ; ; h 
w wymiarze 15 = 0.0838... a nie w wymiarze 19 


7 la 
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Wykonując tytułem przykładu obliczenia dla trze- 
ciej formy szeregu bławatka, otrzymamy: m; = + 5.424. 
© = V 3.958 — 0.083 = | 3.875 = 1.968 i wreszcie Y, = +0.711. 
Dokładna wartość wynosi: y, = + 0.731. 


20. Wskaźnik skupienia wariantów i eksces. Ostatnią cechą 
szeregów rozdzielczych jest stopień skupienia wariantów w po- 
bliżu wartości modalnej. Tu znowu wobec trudności w wyzna- 
czaniu tej wartości trzeba zmienić punkt wyjścia i traktować 
zagadnienie jako kwestię skupienia wariantów przy średniej 
arytmetycznej. Wtedy można ją rozwiązać za pomocą mo- 
mentu czwartego stopnia. Podobnie jak z momentu trzeciego 
stopnia można wyprowadzić miarę skośności, tak z momentu 
czwartego stopnia wywodzi się wskaźnik skupienia wariantów, 
określony przez równanie: 

Ma 


B=— 


o 


Jest to moment czwartego stopnia drugiego rodzaju, gdyż 


można napisać: 
; 4 
8 — Lo PT u 
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A 1 PRZ 
3 ż 


Przybiera on tym większe wartości, im bardziej skupione 
są warianty przy Średniej. Moment czwartego stopnia wpraw- 
dzie zmniejsza się wtedy, ale średnie odchylenie zmniejsza się 
także i to w takim stopniu, że skutkiem podniesienia do czwar- 
tej potęgi zmniejszenie odchylenia wpływa silniej na wynik 
obliczenia aniżeli zmniejszenie momentu. Nietrudno jest to 
wykazać na przykładach. Weźmiemy w tym celu następujące 
szeregi rozdzielcze. 

Rozpoczniemy od szeregów wklęsłych, w których wa- 
rianty są skupione nie w środkowej części szeregu rozdziel- 
czego, lecz na obu jego. końcach. Wypadną przeto szczególnie 
małe wartości wskaźnika skupienia wariantów. Naprzykład za- 


86 § 20 


chmurzenie w Bazylei (tab. 6,14) da m, = 0.03935, o = 0.3922 
a więc 
«__ 0.05935 
“0.02365 
Dalej liczby kwiatów w koszykach sałatnicy (tab. 6,2) bę- 
dziemy mieli: m, = 123.2, o = 2.603 i przeto 6 = 2.685. 
Następnie dla liczby kwiatów języczkowych w koszy- 
kach Senecio fluviatilis (tab. 6,4) otrzymamy: m, = 1.0385 
i o = 0.7155 a więc f = 3.962. 
Dla listków okrywy sałatnicy (tab. 6,2) wypadnie 
m = 1.1754, o= 0.60936 i p= 8.525. 
Dla liczby promieni meduzy Pseudoclytia pentata (tab. 6,5) 
otrzymuje się: m, = 0.50818, o = 0.4516 i 8 = 13.40. 
Wreszcie przytoczony w poprzednim ustępie Senecio octo- 
glossus daje: m, = 0.8209, o = 0.4445 i p = 21.02. 
Widzimy, że wskaźnik skupienia wariantów waha się 
w daleko szerszych granicach niż wskaźnik skośności. 


= 1.664 


Opawianą właściwość szeregów rozdzielczych można 
także określić za pomocą innej jeszcze charakterystyki, zwa- 
nej ekscesem, oznaczanej symbolem Y, Eksces jest 
to wskaźnik skupienia wariantów pomniej- 
szony o 3. Użycie tej charakterystyki ma swój sens przy 
porównywaniu dwubocznych szeregów rozdzielczych z nor- 
malną funkcją prawdopodobieństwa, o której będzie mowa 
w ust. 25. Dla niej wskaźnik skupienia wariantów wynosi 3. 
Skutkiem tego eksces wskazuje, o ile skupienie wariantów 
przy średniej jest mniejsze lub większe niż w szeregach z roz- 
kładem częstości według normalnej funkcji prawdopodobień- 
stwa. Skupienie słabsze niż u takich szeregów jest rzadkie 
i przeto eksces jest przeważnie dodatni. W naszych przykła- 
dach tylko dwa pierwsze mają eksces ujemny: zachmurzenie 
—1.336 i kwiaty sałatnicy —0.315. Poza tym jest on dodatni: 
od + 0.963 u Senecio fluviatilis do + 18.02 u S. octoglossus. 

Dla materiałów zgrupowanych w klasy wskaźnik skupie- 
nia wariantów oblicza się podobnie jak wskaźnik Y}, za pomocą 


charakterystyk wyrażonych w szerokości klas. I tak dla trze- 
ciej formy szeregu bławatka będziemy mieli: m’, = 64.35, 
o’ = 1.968, a zatem f = 4.286. Dokładna wartość wynosi 


Eksces będzie miał odpowiednio wartości +1.286 i --1.427. 


ROZDZIAŁ IV. 
NIEZBĘDNE DLA STATYSTYKI WIADOMOŚCI Z NAUKI 
O PRAWDOPODOBIEŃSTWIE. 

21. Pojęcie prawdopodobieństwa. Zagadnienie prawdopodo- 
bieństwa dotyczy częstości zdarzeń, powodowanych przez dwa 
różne rodzaje przyczyn. Są to z jednej strony przyczyny dające 
się dokładnie ustalić — przyczyny określone, z drugiej 
zaś strony takie, które można scharakteryzować tylko ogólni- 
kowo — przyczyny nieokreślone. Naprzykład częstość 
wystąpienia czarnej karty w ciągnieniach z dobrze wymiesza- 
nej talii kart zależy od dającego się ustalić składu danej talii -— 
od stosunku liczby czarnych kart do ogólnej ich ilości. Zależy . 
nadto od niedającego się przewidzieć układu ich w talii i od 
niedających się przewidzieć tak samo ruchów ręki. Naturalnie 
zakłada się przytem, że szulerskie chwyty nie są stosowane, 
w przeciwnym bowiem razie będą działały tylko przyczyny 
określone i o prawdopodobieństwie nie będzie mowy. 

Częstość zdarzeń, zgodnie z wywodami ust. 5, może być 
rozumiana dwojako — jako częstość bezwzględna, poda- 
jaca liczbę danego rodzaju zdarzeń, i jako częstość wzglę- 
dna, określona stosunkiem liczby zdarzeń do liczby przy- 
padków, w których takie zdarzenia mogą wystąpić. W rozwa- 
żaniach na temat prawdopodobieństwa chodzi zawsze o czę- 
stość względną, którą też dla skrócenia nazywa się zwykle po’ 
prostu częstością. Tak rozumiana częstość wyraża się liczbą 
mniejszą od jedności. W krańcowych przypadkach równa się 
ona zeru i jedności: równa się zeru — jeżeli zdarzenie nie wy- 
stępuje wcale, jedności — jeżeli wystąpi w każdym możliwym 
dla niego przypadku. 

Częstości tego samego rodzaju zdarzeń wypadają różnie. 
Naprzykład francuski zoolog Buffon w r. 1777 określał 
częstość występowania orła w grze w orła i reszkę przy dużej 
ilości rzutów. Było ich 4040. Orzeł wystąpił 2048 razy, częstość 
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zatem wypadła 0.5069. Na początku XIX wieku angielski ma- 
tematyk de Morgan powtórzył te zliczenia i otrzymał tę. 
samą liczbę wystąpień orła na 4092 rzuty. Częstość otrzymał 
zatem równą 0.5005. Belgijski astronom Quetelet, o któ- 
rym była mowa w ust. 2 jako o jednym z twórców współ- 
czesnej statystyki, także przeprowadził w r. 1846 podobne zli- 
czenia, wyjmując kule z urny, zawierającej 20 kul białych 
i 20 czarnych. Takie ciągnienia oczywiście dają wyniki po- 
dobne do rzutów monetą. Biała kula wyszła 2066 razy na 4096 
ciągnień, czyli częstość wypadła 0.5044. 

Przytoczone częstości podobnych: zdarzeń są zbliżone, nie 
są jednak równe. Tylko w bardzo rzadkich przypadkach wy- 
padają one dokładnie sobie równe, ale to nie zmienia postaci 
rzeczy. Otóż fakt, że otrzymywane w doświadczeniu różne 
częstości dla tego samego rodzaju zdarzeń są zbliżone, jest po- 
wodowany przez działanie przyczyn określonych — przez sy- 
metrię monety w grze w orła i reszkę, przez równą ilość czar- 
nych i białych kul w urnie itp. Różnice zaś między poszczegól- 
nymi wartościami częstości pochodzą z działania przyczyn nie- 
określonych, jak ruchy ręki, podskoki monety przy uderzeniu 
o stół, układ kul w urnie i inne podobne okoliczności. 

Gdyby przyczyny nieokreślone nie dzia- 
łały, częstość danego rodzaju zdarzeń wypa- 
dałaby zawsze jednakowa. Taką stałą wartość 
częstości nazywamy prawdopodobieństwem. 

Faktycznie obserwowane częstości są, poza wyjątkowymi 
przypadkami, zbliżone do wartości prawdopodobieństwa. Jest 
ona w przytoczonych powyżej przykładach, jak się zaraz prze- 


: . Zatem odchylenia częstości od niej w tych 
przykładach wynoszą 0.0069, 0.0005 i 0.0044. 

Wartość prawdopobieństwa można obliczyć, jeżeli się zna 
dokładnie przyczyny określone. Wtedy, zakładając że przy- 
czyny nieokreślone nie działają, trzeba najpierw ustalić liczbę 
„jednakowo możliwych a zarazem różnych 


ewentualności, w których może wystąpić dane zdarze- 


konamy, równa 
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nie. Trzeba dalej zliczyć z pośród tych ewentualności takie, 
w których zdarzenie wystąpić musi. Otrzyma się w ten spo- 
sób dwie liczby całkowite. Dzieląc drugą przez pierwszą, otrzy- 
mamy wartość liczbową prawdopodobieństwa dla danego ro- 
dzaju zdarzeń. 

I tak w grze w orła i reszkę są dwie ewentualności: moneta 
spadnie ukazując orła albo reszkę. Obie są równie możliwe, je- 
żeli moneta jest symetryczna i nieuszkodzona. Jedna z tych 
ewentualności daje rozpatrywane zdarzenie, jakim jest ułoże- 
nie się monety na stole orłem do góry. Prawdopodobieństwo 
wypada zatem równe ER Będzie ono inne, jeżeli. skutkiem 
licznych uderzeń o stół moneta zostanie wykrzywiona lub 
w inny sposób uszkodzona. 

W przypadku urny z 20 białymi i 20 czarnymi kulami 
mamy 40 ewentualności, bo wyjęcie każdej kuli jest jedna- 
kowo możliwe, jeżeli są one jednakowej wielkości i są wyko- 
nane z tego: samego materiału. Z tych 40 ewentualności wy= 
stąpienie białej kuli jest pewne w 20, mianowicie kiedy ręka 
sięgająca do urny natrafi kulę tej barwy. Prawdopodobieństwo 

i E rieh 20 1 
takiego zdarzenia jest 40 2* 

Podobnie jest z ciągnieniem kart z talii. Wyciągnięcie 
każdej karty jest jednakowo możliwe. Zatem ilość różnych 
możliwych ewentualności przy użyciu pełnej talii bez jockera 
jest równa 52. Jeżeli będzie chodziło o czarne karty, to tak 
samo wyciągnięcie każdej z nich jest równe możliwe — ilość 
odnośnych ewentualności wyniesie przeto 26. Prawdopodo- 
2 = r . O ile by jednak chodziło o wy- 
ciągnięcie nie byle jakiej czarnej karty, lecz czarnego asa, to 
liczba ewentualności dla takiego zdarzenia spadłaby do 2 
2 1 
ZI 

Różnica między prawdopodobieństwem a faktycznie ob-. 
serwowanymi częstościami na ogół maleje w miarę zwiększe- 


bieństwo wypadnie 


a prawdopodobieństwo do 
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nia liczby przypadków. Jest to tzw. prawo wielkich 
liczb, podstawowe w nauce o prawdopodobieństwie. 

Matematyczne opracowanie tego prawa jest zasługą 
szwajcarskiego matematyka Jaóba Bernoulli (1654 — 
1705), który strawił nad tym zagadnieniem 20 lat życia. Da się 
to prawo sformułować w sposób następujący: 

Jeżeli w szeregu przypadków, w których 
występuje jakieś zdarzenie, prawdopodobień- 
stwo jego wystąpienia nie ulegnie zmianie, to 
przy dostatecznie wielkiej ilości przypadków 
zprawdopodobieństwem dowolnie bliskim jed- 
ności, to znaczy dowolnie bliskim pewności, 
można spodziewać się, że częstość danego 
zdarzenia będzie dowolnie mało różniła się 
od jego prawdopodobieństwa. 

W tej formie prawo wielkich liczb zostało przez Ber- 
noulli*”ego dowiedzione w drodze rozumowań matema- 
tycznych, których nie przytaczam z powodu ich zawiłości. Dla 
przyrodnika i wogóle dla badacza faktów jest to niedosta- 
teczne. Ponieważ to prawo dotyczy obserwacyj rzeczywistości, 
powinno być sprawdzone przez porównania z faktami. W tym 
celu trzeba je ująć inaczej, a mianowicie w sposób nastę- 
pujący. 

Jeżeli będziemy brali coraz większe zbiory 
przypadków, w których występuje jakieś zda- 
rzenie, to ze zwiększeniem tych zbiorów ale 
ciągle w tych samych warunkach coraz czę- 
Ściej wystąpią częstości tego zdarzenia, które 
coraz mniej będą się różniły od jego teoretycz- 
nie obliczonego prawdopodobieństwa. 

Praktycznie rzecz biorąc, można porównanie tak ujętego 
prawa wielkich liczb z faktami przeprowadzić w sposób nastę- 
pujący. Zliczamy, ile razy wystąpi dane zdarzenie w zbiorze 
dziesięciu. przypadków. Powtarzamy takie zliczenie dla wiel- 
kiej liczby, powiedzmy stu, innych zbiorów, liczących także po 
dziesięć przypadków. Otrzymamy na ogół różne częstości dla 
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różnych zbiorów. Obliczmy, ile każda częstość różni się od 
prawdopodobieństwa i jaka wypadnie średnia tych różnie. 
Następnie wykonajmy to samo dla coraz większych zbiorów — 
po 50, 100, 500, 1000 itd. przypadków i porównajmy ze sobą 
otrzymane średnie różnic między częstościami a prawdopodo- 
bieństwem. Te Średnie powinny wypaść coraz mniejsze. 

Takie zliczenia i rachunki były niejednokrotnie wykony- 
wane. Dla większych zbiorów były one jednak nieliczne, co nie 
jest wcale dziwne wobec ogromnej ich uciążliwości. Przytoczę 
poniżej dane, które udało mi się zebrać. Wszystkie one odnoszą 
się do prawdopodobieństwa 2 * 

Zacznę od danych ogłoszonych przez Charliera w jego 
podręczniku (zob. ust. 4). Ten autor przy pomocy swoich przy- 
jaciół wykonał 10 tysięcy ciągnień z talii kart i notował czarne 
karty. Materiał został rozbity na zbiory po 10, 50 i 500 ciągnień 
(tab. 22,1-3). 


Tabela 22,1 


Czarne karty w zbiorach po 10 ciągnień 


Liczby Ilości zbiorów, w których 
czarnych kart one wystąpiły 


3 
10 
43 

116 
221 


Tabela 21,2 
Czarne karty w zbiorach po 50 ciągnień 


Liczby Ilości zbiorów, w których 
czarnych kart one wystąpiły 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 


Tabela 21,3 
Czarne karty w 20 zbiorach po 500 ciągnień 
252, 235, 248, 271, 260, 246, 228, 229, 234, 250, 
271, 234, 258, 288, 278, 244, 249, 241, 231, 245. 
Z danych tabeli 21,3 można utworzyć 10 zbiorów po 1000 
ciągnień, dodając po dwie kolejne liczby. Wypadnie: 487, 519, 
506, 457, 484, 505, 491, 517, 490, 477. Oprócz tego można utwo- 
rzyć 2 zbiory po 4000-ciągnień, dodając po 8 liczb. Wypadną 
w nich liczby czarnych: kart 1969 i 1975. 
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Podobne doświadczenie wykonał Westergaard, ciąg- 
nąc kule z worka, zawierającego równe ilości białych i czer- 
wonych kul (cytuję za Andersonem). Ciągnień było tak 
samo 10 tysięcy. Zostały one zgrupowane w zbiory po sto. 
Liczby białych kul w tych zbiorach są zestawione w tabeli 21,4. 


Tabela 21,4 
Liczby białych kul w zbiorach po 100 ciągnień. 


Liczby Ilości zbiorów, w których 
białych kul te liczby wystąpiły 
34 1 > 
39 
40 z 
41 2 
42 2 
43 3 
44 3 
45 4 
6 


5 
1 

9 
5 


1 


1 
5 
1 
0 
4 
8 
3 
5 
4 
4 
1 
1 
1 


100 
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Dalej mamy przytoczone na początku czterotysięczne 
zbiory Buffona, de Morgana i Queteleta. 

Przychodzą z kolei zbiory dziesięciotysięczne. Dwa takie 
doświadczenia ogłosił Jevons w r. 1887 (cytuję za R om a- 
nowskim). Było to rzucanie monet po 10240 razy. Jedno 
z doświadczeń jest obciążone błędem (być może po prostu cho- 
chlik drukarski). Drugie dało 5222 razy orła, a więc częstość 
0.5100. Do tego dochodzi doświadczenie Charliera z kar- 
tami. Dało ono 4933 razy czarną kartę na równe 10 tysięcy 
ciągnień. Wreszcie doświadczenie Westergaarda dało 
5011 razy białą kulę także na 10000 ciągnień. 


Bardzo ciekawe dane dla rozpatrywanego zagadnienia 
ogłosił Marbe') odnośne do wyników gry w ruletkę. Ru- 
letka posiada, jak wiadomo, równe ilości pól czerwonych 
i czarnych, nadto jedno pole zerowe. Prawdopodobieństwo 
czerwieni wypada równe 14, tak samo jak w grze w orła 
i reszkę, jeżeli nie liczyć wystąpień zera. Marbe obliczył dla 
różnych zbiorów częstości wystąpienia czerwieni dla ruletek 
w Monte Carlo i w Baden-Baden. Wybieram z tych danych 
niektóre liczby 


Monte Carlo 4258 Częstość czerwieni 0.5079 


10479 0.5050 
29922 0.4991 


58597 0.4984 
Baden-Baden 4142 0.5171 


9865 0.5122 
29703 0.5070 


Wreszcie Romanowski ogłosił w r. 1912 w „Warszawskich 
Uniwersitetskich [Izwiestjach” wyniki swoich doświadczeń 
z 80640 rzutami monet. Orzeł wystąpił 39702 razy a więc z czę- 
stością 0.4923. 


1) Karl Marbe. Grundfragen der angewandten Wahrschein- 
lichkeitsrechnung und theoretischen Statistik. — München (1934). 


Obliczając Średnie wartości różnic między częstościami 
a prawdopodobieństwem, otrzymujemy dla tych wszystkich da- 
nych następujące zestawienie (tab. 21,5). 


Tabela 21,5 


Wielkości zbiorów Ich liczby Średnie różnie między 
w przybliżeniu częstościami a prawdo- 
podobieństwem 


10 0.1107 

50 0.0561 

100 0.0409 

500 0.0227 
1000 0.0161 
4000 | 0.0046 
10000 0.0070 
30000 0.0019 

- 58000 0.0016 
80000 0.0077 


Widzimy, że na ogół doświadczenie potwierdza prawe 
wielkich liczb. Dla wielkich zbiorów jednak kwestia pozostaje 
niewyjaśniona, a to z dwóch powodów. Po pierwsze doświad- 
czenia z takimi zbiorami są nieliczne i przeto niemiarodajne, 
bo najmniej nawet prawdopodobne zdarzenia czasem wyste- 
pują. Po wtóre w doświadczeniach z wielkimi zbiorami trzeba 
mieć na uwadze to, że prawo wielkich liczb zachowuje swoją 
wartość tylko wtedy, jeżeli zdarzenia występują dokładnie 
w tych samych warunkach. Otóż przy wielkich zbiorach przy- 
padków jest to praktycznie niewykonalne. Jeżeli zdarzenia do- 
tyczą występowania takich czy innych kart w ciągnieniach, 
sposób mieszania ich powinien być ciągle taki sam, co nieko- 
niecznie ma miejsce. Nadto stan kart powinien być ten sam, 
a przecież one Ścierają się i stają się lepkie przez ciągłe ze- 
tknięcie się z dłońmi. Podobnie jest w doświadczeniu z rzu- 
caniem monet — ścierają się one przy uderzeniach o stół itd. 


22. Prawdopodobieństwo całkowite i złożone. W poprzednim 
ustępie omawialiśmy najprostszą a zarazem podstawową formę 
prawdopodobieństwa, które dotyczyło pojedyńczego zdarzenia. 
Zagadnienia prawdopodobieństwa mogą oczywiście dotyczyć 
także dwu i więcej zdarzeń. Zdarzenia te mogą wykluczać się 
wzajemnie albo przeciwnie występować łącznie. Stosownie do 
tego będziemy mieli oprócz prawdopodobień- 
stwa prostego — prawdopodobieństwo całko- 
wite i prawdopodobieństwo złożone. Trzeba 
umieć obliczać te bardziej złożone formy prawdopodobieństwa 
na podstawie prawdopodobieństwa prostego poszczególnych 
zdarzeń. f 

Prawdopodobieństwo całkowite dotyczy zdarzeń: wyklucza- 
jących się wzajemnie. Obliczenie wartości prawdopodobieństwa 
jest w tym przypadku bardzo proste. Jeżeli z dwóch 
rodzajów zdarzeń wykluczających się wza- 
jemnie jedno ma prawdopodobieństwo Py 
a drugie p.,, to prawdopodobieństwo całkowite, 
że zajdzie albo pierwsze, albo drugie zdarze- 
nie, jest równe ich sumie: p=p,.+ Da Naprzykład, 
jakie jest prawdopodobieństwo, że z talii kart wyciągniemy 
albo pika, albo czerwonego asa? Prawdopodobieństwo pierw- 


5 
, drugiego zaś 52 * Prawdopodo- 


szego zdarzenia jest 50 
bieństwo, że ciągnąc kartę natrafimy albo na pika, albo na 

A ENI in 2 15 ` 
czerwonego asa, jest oczywiście 59 b B3 = ga - Podobnie 
będzie, jeżeli będzie chodziło o większą ilość różnych a wy- 
kluczających się rodzajów zdarzeń. 

Z prawidła całkowitego prawdopodobieństwa wynika, że 
jeżeli weźmiemy wszystkie możliwe w pewnym zakresie ro- 
dzaje zdarzeń, to suma ich prawdopodobieństw będzie równa 
jedności. lstotnie wtedy którekolwiek zdarzenie wystąpi z pew- 
nością a pewność to jest prawdopodobieństwo równe jedności. 
Stąd wypływa ważny wniosek dotyczący prawdopodobieństwa 
niewystąpienia zdarzenia. Jeżeli prawdopodobień- 


Zadania i metody statystyki 
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stwo wystąpienia zdarzenia jest p, to praw- 
dopodobieństwo q niewystąpienia go będzie 
równe 1—p. Naprzykład można postawić pytanie, jakie jest 
prawdopodobieństwo niewyciągnięcia pika. Ponieważ prawdo- 
zzo 
podobieństwo wyciągnięcia takiej karty równa się go = 
prawdopodobieństwo wystąpienia jakiegokolwiek innego koloru 


jest 1 — 

Przechodzimy z kolei do prawdopodobieństwa złożonego. 
Odnosi się ono do częstości łącznego występowania dwóch lub 
wielu niezależnych od siebie rodzajów zdarzeń, np. do wyciąg- 
nięcia czarnej karty z jednej talii i jednocześnie czerwonego 
asa z drugiej. Otóż prawdopodobieństwo złożone 
równa się iloczynowi prawdopodobieństw da- 
nych rodzajów zdarzeń. 


Jeżeli dajmy na to mamy dwa rodzaje zdarzeń i prawdo- 
podobieństwo jednego z nich jest p, a drugiego p, to prawdo- 


podobieństwo łącznego wystąpienia tych dwóch rodzajów zda- 
rzeń będzie równe p = ppa. 


A więc w przytoczonym przykładzie prawdopodobieństwo 


wyciągnięcia czarnej karty równa się -5  , prawdopodobień- 


A SEA? 1 
stwo zaś wyciągnięcia czerwonego asa jest 56 * Przeto praw- 
dopodobieństwo łącznego wystąpienia tych zdarzeń równa się 
1 1 1 

X - 


5 26 7 52 * W istocie, ponieważ każda karta jednej 
talii może spotkać się z każdą kartą drugiej, ilość różnych jed- 
nakowo możliwych ewentualności jest 52X52. Wśród nich 
każda z 26 czarnych kart może spotkać się z każdym z 2 czer- 
wonych asów. Zatem liczba różnych spotkań tego rodzaju jest 
26X2. W ten sposób prawdopodobieństwo spotkania się czarnej 
26x2 1 
S2X02  G204 
samo można rozumować w każdym innym przypadku. 


karty z czerwonym asem wypada równe 
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23. Prawdopodobieństwo powtarzania się zdarzeń. Szereg 
dwumianowy. Podane w poprzednim ustępie twierdzenie 
o prawdopodobieństwie złożonym może być stosowane nie tyl- 
ko do łącznego występowania różnych rodzajów zdarzeń, lecz 
także do łącznego występowania tego samego rodzaju zdarzeń, 
a więc może być użyte do obliczenia prawdopodobieństwa po- 
wtórzeń tego samego zdarzenia. To zagadnienie było opraco- 
wane na przełomie XVII i XVIII wieku przez Bernoulliego, 
o którym była już mowa w ust. 21. 

Rozpatrzmy z początku najprostszą formę zagadnienia, 
kiedy zdarzenie występuje najwyżej dwukrotnie. Tym zdarze- 
niem niech będzie występowanie czarnej karty w ciągnieniach 
z talii. A więc ciągnijmy z dwóch talii po jednej karcie albo, 
co na jedno wyjdzie, ciągnijmy z tej samej talii powtórnie po 
włożeniu do niej z powrotem wyciągniętej poprzednio karty 
i po przetasowaniu talii. Będziemy mieli cztery równie możli- 
we ewentualności: 1) pierwsze i drugie ciągnienie dadzą czer- 
wone karty, 2) pierwsze da czerwoną, a drugie czarną, 
3) pierwsze czarną a drugie czerwoną i wreszcie 4) oba ciągnie- 
nia dadzą czarne karty. Oznaczymy zjawienie się czarnej karty 
znakiem +, czerwonej znakiem —. Będziemy wtedy mogli ze- 
stawić omawiane ewentualności w formie następującej: 


ti Zo z 

AES ia 

280, wy *1 R 

4) - JA 

Są tu zestawione we wszelki możliwy sposób dwa różne 
rodzaje zdarzeń. Podobne zestawienia noszą nazwę prze- 
mian (wariacyj). Zestawienie zbiorów tak mało licznych jest 
proste. Natomiast dla większych zbiorów zadanie staje się 
o wiele trudniejsze, zwłaszcza jeżeli są rozpatrywane nie dwie 
tylko jak tu ewentualności, lecz większa ich ilość. Istnieje na- 
wet osobna gałęź matematyki, kombinatoryki*), która 
się tym zajmuje. 

1) Najbardziej wyczerpującym źródłem w tej dziedzinie jest książka 
E. Netto. Lehrbuch der Combinatorik (Lipsk, 2 wyd. 1927). 


7* 
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Widzimy odrazu, że przemiana 1 nie da żadnej czarnej 
karty, przemiany 2 i 3 dadzą jedną czarną kartę, wreszcie 
przemiana 4 da dwie karty czarne. Prawdopodobieństwo każ- 
dej przemiany jest według prawidła złożonego prawdopodo- 

1 1 


bieństwa > X E. Składając prawdopodobieństwa 


przemian 2 i 3, otrzymamy dla jednorazowego wystąpienia 
czarnej karty prawdopodobieństwo podwójne. Ostatecznie wy- 
padnie następujący szereg prawdopodobieństw: 
Liczby czarnych kart w zbiorach 0 1 
Ich prawdopodobieństwa À 4 
Suma tego szeregu wypada równa jedności, co jest na- 
turalne, bo są tu uwzględnione wszystkie możliwe ewentual- 
ności, jakie mogą wystąpić w dwójkowych zbiorach ciągnień. 
Ciągnijmy następnie karty trzykrotnie — będziemy mieli 
trójkowe zbiory przypadków. Liczba jednakowo możliwych 
zestawień będzie teraz dwa razy większa niż poprzednio. Istot- 


nie każdej przemianie dwójkowych zbiorów będą tu odpowia- 
dały dwie, bo w trzecim ciągnieniu może wyjść zarówno czer- 
wona jak czarna karta. Oznaczając literami a i b ewentualności 
trzeciego ciągnienia, możemy zestawić następujący zespół prze- 
mian: 


1 a) 
1 b) 
2 a) 
2 b) 
3 a) 
3 b) 
4a) 
4 b) 


Teraz przemiana la nie da żadnej czarnej karty, przemia- 
ny 1b, 2a i 3a dadzą jedną czarną kartę, 2b, 3b i 4a — dadzą 


dwie i wreszcie przemiana 4b — trzy czarne karty. Prawdo- 


1 1 
podobieństwo każdej przemiany jest = d a = 8 
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Składając prawdopodobieństwa, otrzymamy szereg prawdopo- 
dobieństw dla trójkowych zbiorów: 


Liczby czarnych kart w zbiorach: 1 2 3 


RA $ r Ts KA 
Ich prawdopodobieństwa: kg 8 xX 8 3X 8 8 


Suma wyrazów szeregu znowu równa jest jedności. 


Zastosujemy z kolei takie rozumowanie do czwórkowych 
zbiorów ciągnień. Znowu każdej przemianie poprzedniego za- 
dania będą odpowiadały dwie przemiany a i b nowego. Otrzy- 
mamy 16 przemian: 


aa) 
ab) 
ba) 
bb) 
aa) 
ab) 
ba) 
bb) 
aa) 
ab) 
ba) 
bb) 
aa) 
ab) 
ba) 
bb) 


i: 
1 
1 
1 
2 
2 
2 
2 


BRA BwWwW w w 


Prawdopodobieństwo każdej przemiany będzie 
1 Í 1 1 
| WRA ET TOAN, 
wej liczbie czarnych kart, ułożymy szereg prawdopodobieństw: 


Liczby czarnych kart w zbiorach:0 1 2 3 4 


ioh . T N$ ARE 1 1 f 1 i 
Ich prawdopodobieństwa: 16 4X 16 6X 16 4X 16 16 


Zliczając przemiany o jednako- 
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Rozumując w podobny sposób dla zbiorów po 5,kart, otrzy- 

mamy szereg: 

Liczby czarnych 

kart w zbiorach: 2 3 

Ich prawdopo- ; 1 „sł 

dobieństwa: Pe "ee a 

Tak samo można rozumować dalej przy coraz większej 
ilości ciągnień. Zawsze przy tym suma prawdopodobieństw bę- 
dzie równa jedności. 

Porównując ze sobą otrzymane szeregi prawdopodobieństw, 
widzimy, że ich współczynniki są takie same, jak w rozwinię- 
ciu dwumianu Newtona takiego samego stopnia jak liczba 
przypadków w danych zbiorach. Oznaczając prawdopodo- 
bieństwo wyjścia czarnej karty przez p, prawdopodobieństwo 
zaś wyjścia czerwonej, to znaczy nie wyjścia czarnej, przez q, 
możemy odnośne rozwinięcia napisać w formie: 


(q + p)” =q' + 2qp + p” 

(q Ft p)” =q* + 3q'p + 3qp* t p” 

(q+ p)' = q' + 4q'p + 6q7p* + 4qp' + p* 

(q t p) = q* +:5q'p + 10q'p* + 10q/p' F5q' + p* 


Nietrudno jest stwierdzić, że te wielomiany nietylko mają 
takie same współczynniki jak rozpatrywane szeregi prawdopo- 
dobieństw, lecz dają wprost wyraz po wyrazie odnośne praw- 
dopodobieństwa, jeżeli wstawimy w miejce p i q ich liczbowe 
wartości, które tu są obie równe łe. Stąd te szeregi noszą 
nazwę dwumianowych. Nazywa się je także szeregami 
Bernoulliego. 

To jeszcze nie wszystko. Rozwinięcie dwumianu Newtona 
daje prawdopodobieństwa powtórzeń zdarzenia także wtedy, 
kiedy prawdopodobieństwo wystąpienia go nie jest równe 
prawdopodobieństwu niezjawienia się. Rozpatrzmy naprzykład 
prawdopodobieństwo wyciągnięcia nie byle jakiej czarnej 
karty, lecz specjalnie pika. Prawdopodobieństwo zdarżenia bę- 


3 
dzie teraz 4 a nie wystąpienia go — 4% 
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Możemy tu wykorzystać te same zestawienia przemian, 
jakie mieliśmy poprzednio, ale ich prawdopodobieństwa nie 
będą jednakowe. I tak oznaczając literą p z odpowiednim 


znaczkiem ich prawdopodobieństwa, będziemy mieli dla dwój- 
forów: p= > x2 = (2) OE a: -1 
kowych zbiorów: p, = 4 X P Nar) P wały 


E LETTE E 
EN EAN F A 
Wypadnie wtedy szereg prawdopodobieństw według dwumianu 
drugiego stopnia (q + p), jeżeli w nim wstawimy q= ; 


ai E 
p=", , a mianowicie: 


4 Ł 


Liczby pików w zbiorach: 1 


2 
ZZ 3 j gai í ) 
ZE x E e Aea A | 
Ich prawdopodobieństwa: SPETA 4 [b 2 


W trójkowych zbiorach otrzymamy dla różnych występu- 
jących w nich przemian prawdopodobieństwa, które można 
zestawić w sposób następujący, jeżeli się oznaczy je po prostu 
znaczkami przemian w kwadratowych nawiasach: 


ID] =|2a|-= [38] = (- + 


wio) 


Wypadnie zatem szereg prawdopodobieństwa według dwu- 
3 1 43 
i OBWE 
mianu trzeciego stopnia ( germ ) . 


Liczby pików w zbiorach: 0 2 


3 4 
a3 9\2 5 2 3 
Ich prawdopodobieństwa: (-;-) 3 <(4) Xe sxĄ <(4) (2) 
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Tak samo można przerobić czwórkowe zbiory. Będziemy 
mieli następujące prawdopodobieństwa różnych przemian: 


[taa] = ( ay 


[Lab] = [iba] = [2aa] = [Baa] = (Ž) x 


[1bb] = |2ab| = |[2ba] = |3ab] = [4aa] = EL 4 (I. 


[2bb] = |3bb] = |4ab] = |4ba] = : S ( i | 


4 
w= (a 


Szereg prawdopodobieństw wypadnie zgodnie z dwu- 


4 
mianem ($ A ER : 


4 4 
Liczby 


pików w 
zbiorach: 0 ; 1 2 3 4 
liena EVE sx(3)x(1) ax (1) (2) 
bieństwa G 4 4 4 4 4 14] V4 


Tak samo będzie dla zbiorów jeszcze większych. 
Porównując ze sobą szeregi dwumianowe widzimy, że 
prawdopodobieństwo niewystąpienia zdarzenia jest równe 
pierwszemu wyrazowi szeregu, prawdopodobieństwo jedno- 
krotnego wystąpienia równe drugiemu wyrazowi, dwukrot- 
nego — trzeciemu, trzykrotnego — czwartemu itd. Dochodzimy 

w ten sposób. do ogólnego prawidła: 

Jeżeli prawdopodobieństwo wystąpienia ja- 
kiegoś zdarzenia jest p a prawdopodobieństwo 
niewystąpienia go q = 1 — p, to prawdopodo- 
bieństwo,żezdarzenie wystąpi k razy w zbio- 
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rach pon przypadków, jest równe (k+ 1)-nemu 
wyrazowi dwumianu (q+p)”. Takie prawdopo- 
dobieństwowyrażasięwzorem: 


2 (n — 1) POR SZEŚC TŁ) qE pK 
KZ t NY k 


Ten wzór można napisać w formie bardziej przejrzystej, 
jeżeli użyje się tzw. silni, iloczynów kolejnych liczb całkowi- 
tych od jedynki począwszy. Silnie oznacza się ostatnią liczbą 
z wykrzyknikiem, np. 1. 2. 3. 4.5. przez 5! Rozpatrywany wzór 
będzie wtedy: 


n! n-k_k 
——— q P 
k!(n— k)! 


Przy stosowaniu jego trzeba mieć na uwadze, że > O! 
jest równa jedności. 

Do obliczenia wyrazów szeregu dwumianowego wypada 
ciągle obliczać współczynniki dwumianu Newtona. Jest to 
bardzo kłopotliwe przy wysokich potęgach. Dla ułatwienia 
można przytem korzystać z tzw. trójkątu Pascala. Układa 
się go w sposób następujący. Piszemy w pierwszym wierszu 
dwie jedynki. W drugim wierszu piszemy między nimi ich 
sumę i dopisujemy z obu stron nowe jedynki: 


Dodajemy następnie stojące obok siebie liczby drugiego 
wiersza i wpisujemy sumy w trzecim wierszu pomiędzy odnoś- 
nymi liczbami drugiego. Oprócz tego dopisujemy znowu je- 
dynki po obu stronach: 


Postępując tak samo dalej, ułożymy trójkąt Pascala. 
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który naturalnie można przedłużyć do nieskończoności. Poniżej 
podaję go w formie doprowadzonej do 10-go stopnia: 


1 9-36 84 126 12684 36 9 1 
1 10 45 120 210 252 210 120 45 10 1 


By otrzymać współczynniki dwumianu k-ego stopnia trzeba 
wziąć wiersz numer k. 

Suma współczynników dla dwumianu k-ego stopnia równa 
się 2%, np. dla dwumianu 10 sotpnia wynosi 1024. Istotnie mamy 
(1 +1) ¥ = 2, 

Przy bardzo wysokich potęgach nawet użycie trójkąta 


Pascala jest zbyt mozolne. Można wtedy sobie radzić, ujmu- 
! 
jąc spółczynniki za pomocą silni a więc w formie kl( sa k) A 
a PŁ RIU 
Jest to wygodne dzięki wzorowi angielskiego matematyka 
Stirlinga, który daje możność przybliżonego wprawdzie 
ale wygodnego obliczenia silni. Wzór ten jest następujący: 


nx 


m =1.2.8..:.n=J2rn=>n"Xe" 


W nim e jest przestępną liczbą, którą można obliczyć za 
pomocą nieskończonej sumy: 


1 dY BA 
Mngr 
Jej przybliżona wartość wynosi: 2.718251828459045... 
Porównując ze sobą różne szeregi dwumianowe, łatwo jest 
stwierdzić, że jeżeli prawdopodobieństwo wystąpienia zdarzenia 
jest równe połowie a więc jeżeli q=p, to szereg będzie syme- 
tryczny, w przeciwnym razie — skośny. l tak dla czwórkowych 


OZ Feita 
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zbiorów przy p= *2 wypadł nam szereg (wyrażony w szesna- 
stych częścach jedności): 1, 4, 6, 4, 1. Natomiast przy p=M 
otrzymaliśmy (w 256-ych częściach jedności) : 81, 108, 54, 12, 1. 

Skośność w drugim przypadku wypadła bardzo silna, bę- 
dzie ona jeszcze silniejsza, jeżeli pi q będą się jeszcze bardziej 
różniły. Szereg przy dostatecznie dużej różnicy między tymi 
prawdopodobieństwami może stać się nawet jednobocznym. 
I tak przy p='/v, q= lv wypadnie on (w dziesięciotysięcznych 
częściach jedności) dla czwórkowych zbiorów: 6561, 2916, 486, 
36, 1. 

Zwiększenie zbiorów wyrównuje skośność w znacznym 
stopniu nawet przy dużej różnicy między p i q. I tak Yule 
obliczył następujące prawdopodobieństwa (w dziesięciotysięcz- 
nych częściach jedności) dla zbiorów złożonych ze 100 przy- 
padków przy p = '/v (tab. 23,1). W tej tabeli wartości mniejsze 
od połowy dziesięciotysięcznej są pominięte. Tak małe prawdo- 
podobieństwa wypadają dla wysokich liczb powtórzeń, miano- 
wicie dla 24 do 100. Równie małe jest prawdopodobieństwo nie 
wystąpienia zdarzenia. 


Tabeła 23,1 
Prawdopodobieństwa różnych powtórzeń zdarzenia o praw- 
5 w zbiorach złożonych ze 100 przypadków 
(dziesięciotysięczne części jedności). 


dopodobieństwie - 


Liczby powtórzeń Ich prawdopodobieństwa 


oO 
| 


IDI AW MD 
+ 
DI 
© 
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Liczby powtórzeń Ich prawdopodobieństwa 


1148 
1304 

. 1319 
1199 
988 
143 
513 


Ponieważ szereg dwumianowy obejmuje prawdopodobień- 
stwa wszystkich możliwych zestawień zdarzeń, suma jego wy- 
razów jest zawsze równa jedności. Daje to możność sprawdza- 
nia obliczeń. 

Użycie dwumianu Newtona do obliczania prawdopodo- 
bieństw można rozszerzyć na zagadnienia, w których chodzi 
o powtarzanie się nie jednego zdarzenia, lecz dwóch i więcej. 
Można naprzykład postawić sobie zadanie obliczyć prawdopo- 
dobieństwa występowania czarnych kart i kierów. Nie będe 
omawiał szczegółowo takich zagadnień, gdyż jest to dosyć za- 
wiłe. Podam tylko gotowy wzór. 

Niech będą Ppi, Po ...p prawdopodobieństwa 
występowania s różnych rodzajów zdarzeń, 
przy czym suma tych prawdopodobieństw jest 
równa jedności Wówczas prawdopodobień- 
stwo wystąpienia a, razy pierwszego rodzaju 
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zdarzeń a jednocześnie a, razy zdarzeń dru- 
giego rodzaju itd. i a; razy ostatniego ro- 
dzaju w zbiorach po n przypadków, gdzie 
RAFA o. . Fa, ma ZzidiSLĘ: wz or em: 


era äs 
PAER a n 
ag- 


Jest to ogólny wzór wyrazu w wielomianie (p; + Pa t.... 
+ ps)” 

Dla wyjaśnienia, jak się korzysta z powyższego wzoru, 
obliczmy jakie jest prawdopodobieństwo, że w zbiorach cią- 
gnień po 5 kart otrzyma się trzy czarne karty i jednego kera. 
Prawdopodobieństwo czarnej karty jest 1/2, jest to p,. Prawdo- 
podobieństwo kera jest 74, mamy zatem p,=14. Ponieważ 
suma tych prawdopodobieństw jest mniejsza od jedności, trzeba 
jeszcze wprowadzić trzecie — prawdopodobieństwo wystąpienia 
kart nieczarnych i niekerów p = 14 . Odnośne liczby powtórzeń 
bESEELAŻZEJN AZ ZIE Prawdopodobieństwo tych powtó- 
rzeń wypadnie: 


DAE 2. |< PZ d SĘ 
314174! 'v2 + + 128 
Szereg dwumianowy ma podstawowe znaczenie dla nauki 
o prawdopodobieństwie i statystyki. Nie dość na tym, że sam 
przez się odgrywa poważną rolę, ale nadto wywodzą się z niego 
dwie doniosłe koncepcje — normalna funkcja prawdopodobień- 
stwa zwana inaczej funkcją de Moivre'a i szereg Pois- 
sona. W dalszych ustępach zajmiemy się tymi koncepcjami. 


24. Charakterystyki szeregu dwumianowego. Szeregi roz- 
dzielcze wielu materiałów statystycznych są podobne do sze- ` 
regu dwumianowego. W tym szeregu liczby powtórzeń grają 
rolę zmiennej ewentualnej a ich prawdopodobieństwa rolę czę- 
stości. Analogia jest bardzo Ścisła, bo prawdopodobieństwo, jak 
widzieliśmy w ust. 21, jest graniczną wartością częstości przy 
zwiększaniu liczby przypadków, jeżeli częstość jest wzięta 
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w formie częstości względnej. Wobec tego jest konieczne usta- 
lenie dla szeregu dwumianowego takich samych charaktery- 
styk, jak dla szeregów rozdzielczych. 

Rozpoczniemy od średniej arytmetycznej. Zastosujemy tu 
naturalnie metodę wartości wyjściowej, przyjmując tę wartość 
równą zeru. Użyjemy znanego nam schematu rachunkowego 
(tabl. 24,1). 


Tabela 24,1 


x (liczby ' f ich prawdo- 
powtórzeń) podobieństwa 


0 


nq""'p 
n.(n—1)q""* p? 


nin -=1)0RS=2) 6 Sc559 
1.2 hw 


Sumując iloczyny xf i wynosząc za nawias wspólny czynnik 
np, otrzymamy jako sumę odchyleń od wartości wyjściowej wy- 
rażenie: 

f! (n — 1) (n— 2) 
enp a amn pE Aoii 


aj GR p” + PE. 


Wielomian w nawiasie jest niczym innym jak dwumianem 
Newtona (q--p)”-t. Ponieważ suma wyrazów takiego 
dwumianu równa się jedności, wypadnie © xf=np. Dla otrzy- 
' otrzymania pomocniczego momentu m, trzeba sumę odchyleń 
podzielić przez sumę f, a ponieważ jest to suma wyrazów dwu- 
mianu (q+p)””, która jest równa jedności, dzielenie jest 
zbyteczne i otrzymujemy odrazu m, =np. Taką samą wartość 
będzie miała Średnia arytmetyczna, gdyż wartość wyjściowa 
jest równa zeru. 
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Przychodzimy teraz do momentów. Pomijamy częściowe 
momenty pierwszego stopnia, gdyż do nich obliczenia trzeba 
oddzielić minus warianty od plus wariantów. Jest to łatwe 
w poszczególnych przypadkach, natomiast w formie ogólnych 
wzorów jest niemożliwe. Przechodzimy więc do momentów 
wyższych rzędów. I tak dla momentu drugiego stopnia bę- ` 
dziemy mieli, przyjmując znowu jako wartość wyjściową, zero 
(tab. 24,2). Sumując iloczyny fx? i wyciągając za nawias 
wspólny czynnik np, otrzymamy: 

(n—1) n—2) 


Efx? =np|q"-' +2(n—1)q%*p3--— 1% 


LBG łów 


(n— 1) (n—2) (n—3) Í 
uż 1.2.5 AD RATA 


Tabela 24,2 
f x 
q” 0 
ng tp 1 nqą”'p 


n(n=1)___, > 4 


gr 


A 2n (n= ig Tp 
n (n—1) (n—2) an(n—1)(n—2) 


c Ek! J? 3 se Tt € n—3 J? 
12:3 i 1.2 ZAŁ, 


Ee DEC E 
1.2.3.4 1.2.8 


q% po 


Wielomian zawarty w nawiasach przekształcamy w ten 
sposób, by z niego wydzielić dwumian (q +'p) **: 
r (n=1) (n—2) 
1.2 


GRES 1 


£ fL = np |07 + (n — 1)q%-*%p 


(n- Da- 2) (n — 3) 
rz 3 
dż i TA EED T TEA 
(n— 1) (n— 2) qp 4-3) (n—1) (n — 2) (n — 3) 
1.2 1.2.3 


PDE +".... + (n—1)4%*p" 


gE P- > T 
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Mamy teraz w nawiasach dwa wielomiany. Pierwszy z nich 
jako suma wyrazów szeregu dwumianowego jest równy jed- 
ności. Co do drugiego, porównajmy go z wyprowadzoną po- 
przednio sumą odchyleń od zera wyrazów szeregu (q -+ p)”. 
Widzimy, że ten drugi wielomian da się wyprowadzić z wyra- 
żenia dla wspomnianej sumy, jeżeli n zastąpi się przez n—1. 
Jest to zatem średnia arytmetyczna szeregu (q+ p)" '' a więc 
ma wartość (n—1)p. W ten sposób dla sumy iloczynów fx* 
wypadnie wyrażenie np [+ (n—1)pl, czyli np + np — np. 
Otrzymaliśmy w ten sposób pomocniczy moment u, gdyż dzie- 
lenie przez % f=1 jest zbyteczne. Ostatecznie dla momentu 
drugiego stopnia otrzymamy: 


M; =p pl =np tnp np- mp = np—np" = np (1 —p) = npq 


Stosując tę samą metodę do momentów trzeciego i czwarte- 


go stopnia, otrzymamy: 
m; =npq (p — 9) 
m, = 3n'p'q* + npq (1 — 6pq) 


Wyprowadzenie tych wzorów jest zbyt zawiłe, by je tu 
przytaczać. 


25. Normalna funkcja prawdopodobieństwa. Widzieliśmy 
w ust. 23, że w szeregu dwumianowym skośność powodowana 
przez różnicę między prawdopodobieństwami p i q wyrównuje 
się przy należytym zwiększeniu n. Mało tego, można dowieść, 
że przy nieograniczonym zwiększaniu n szereg dwumianowy 
zbliża się do pewnej stałej postaci, określonej funkcją 


W tym równaniu e jest znaną już nam liczbą przestępną 
a wielkość o jest stałą wielkością, która może mieć różne war- 
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tości. Ta funkcja nosi nazwę normalnej funkcji praw- 
dopodobieństwa albo funkcji de Moivre'a. Zwy- 
kle przypisuje się ją Laplaceowi albo Gaussowi. Jest 
to niesłuszne. Jak to stwierdził Pearson, de Moivre zaj- 
mował się nią o wiele wcześniej — od r. 1733 w dziele „Miscel- 
lanea analytica”. 

Dla należytego wyjaśnienia związku między szeregiem 
dwumianowym a funkcją de Moivrea, trzeba użyć przed; 
stawienia graficznego (ryc. 3). 


© -C ——+QT — 


Ryc. 3 


Widzimy na takim wykresie, że krzywa funkcji wznosi 
się najwyżej dla x= 0. Od tego punktu opada ona symetrycz- 
nie w obie strony, idąc nieskończoność. Z początku obie gałęzie 
są wklęsłe względem osi odciętych, następnie począwszy od 
x= -+ o dla prawej gałęzi i od x =— o dla lewej stają się wy- 
pukłe. Jedna i druga stopniowo i bezgranicznie, asymptotycz- 
nie jak się to mówi, zbliżają się do osi odciętych. Kształt krzy- 
wej przypomina w pewnym stopniu klosz albo według do- 
wcipnego francuskiego określenia kapelusz żandarma. Ten 
„Kapelusz? jest tym bardziej wysmukły, im mniejsza jest 
wielkość o, z jej zwiększeniem przypłaszcza się. 


Zadenia i metody statystyki 
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Wobec wielkiego znaczenia funkcji de Moivre'a obli- 
czono z wielką dokładnością jej wartości, biorąc je w formie 
$ 
2 


w której stała o jest wyłączona. Taką formę przybiera równa- 


. +. . . U . 
nie funkcji przez zmianę zmiennych: Œ= o ë, y BSF. Zmienne 
e] 


¢ i noszą nazwę normalnych. Za pomocą przytoczonych 
wzorów można przy danym o obliczyć wartość y dla każde- 
go x według wartości funkcji o (6). Te wartości zostały obli- 
czone według równania nieskończonej sumy: 


co E4 EG 
s 1 g. 5. 


80 2 gl 
W tabeli 25,1 są zestawione wartości funkcji go (6) dla 
dodatnich wartości ć w odstępach 0.1. Dla ujemnych wartości 


tej zmiennej będą naturalnie takie same wartości funkcji jak 


Tabela 25,1 


Funkcja de Moivrea 


q ją (OBARNRG ONAR EE h 


0.3989 0.1714 
3970 1497 
1295 


3910 

3814 1190 
3683 0940 
3521 0790 
3332 0656 
3123 
2897 
2661 
2420 
2179 
1942 
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dla odnośnych dodatnich wartości Ś, bo ta zmienna występuje 
podniesiona do kwadratu. Wartości 7 od 6 = 4.3 począwszy są 
mniejsze od '/> X 0.0001 i przeto są podane w tabeli w formie 
0.0000. W końcu książki (tabela A) będą podane wartości o, ($) 
w odstępach 0.01. 

Dla przeprowadzenia porównania funkcji de Moivrea 
z szeregiem dwumianowym i wogóle z szeregami rozdzielczymi 
trzeba obliczyć dla niej średnią arytmetyczną i momenty. 
W tym celu trzeba powrócić do graficznego przedstawienia 
szeregów rozdzielczych, omówionego w ust. 5. Były tam podane 
dwa sposoby tego przedstawienia: za pomocą łamanej linii 
(ryc. 1) i za pomocą tzw. histogramu, złożonego z prosto- 
kątów (ryc. 2). Było przytem zaznaczone, że histogram jest 
bardziej celowy, a mianowicie lepiej nadaje się do porówny- 
wania szeregów rozdzielczych z ciągłymi funkcjami, takimi 
jak funkcja de Moivrea. 

Otóż widzieliśmy, że histogram buduje się w sposób na- 
stępujący. Każdy wyraz szeregu zostaje przedstawiony prosto- 
kątem o podstawie równej jedności, z wysokością równą często- 
ści. Przytem skala szerokości może być dla wygody wybrana 
inna niż dla wysokości. Ponieważ szerokość klas w materiale 
niegrupowanym jest równa jedności, pole każdego prostokąta 
w histogramie równa się odnośnej częstości a suma tych pól 
równa się liczbie wariantów. To samo będzie z materiałem 
zgrupowanym, o ile przyjmie się szerokość klas za jednostkę 
do pomiaru wartości wariantów, co prowadzi do użycia „nume- 
rów” do oznaczenia wyników takich pomiarów. 

Zastosujmy ten sam sposób rozumowania do krzywej przed- 
stawiającej funkcję de Moivre'a. Dzielimy figurę ograni- 
czoną przez krzywą i oś odciętych na wycinki za pomocą szeregu 
rzędnych (ryc. 4). Te wycinki o kształcie zbliżonym do trapezów 
będą odpowiednikami prostokątów histogramu. Wszystkie ich 
boki, z wyjątkiem górnego, będą prostoliniowe. 

Podstawa każdego wycinka będzie odpowiednikiem przedziału 
klasowego w szeregach rozdzielczych, pole jego — odpowiedni- 
kiem odnośnej częstości. 


Ryc. 4 
Pola podanych powyżej wycinków krzywej funkcji de 
Moivre'a, ograniczonych przez dwie sąsiednie rzędne, można 
obliczyć zgrubsza, przyjmując wycinek za trapez. Jeżeli od- 
nośne rzędne mają wartości é, i 6, (6, >Ś,), to pole wycinka 
będzie w przybliżeniu równe 


lẹ o ($2) F Po (,)] (a —£,) 
2 


Naprzykład jeżeli $, = 1.1, $,= 1.0, otrzymamy na pod- 
stawie tabeli 25,1 wielkość pola wycinka równą 


[0.2179 + 0,2420] X 0.1 
2 


= 0.0230 


W tym wypadku wypada wartość dokładna do czwartego 
znaku dziesiętnego. Niezawsze tak jest. Ogólnie wynik będzie 
tym dokładniejszy, im rzędne są bliższe a więc wycinek węższy. 
Dokładne wartości pól dla wycinków dowolnej szerokości można 
otrzymać tylko za pomocą rachunku całkowego, obliczając 
tzw. całką Laplacea 


£9 
—g 


Daje ona wielkość pola figury ograniczonej przez oś od- 
ciętych, lewą część krzywej i rzędną dla danej wartości ć 
(ryc. 5). Dla é = —co całka 


| 
| 
| 
l 


+ § -> 


Ryc. 5 


A E 


Laplacea równa się zeru, dla ś=0 przybiera wartość */2, 
a przy nieograniczonym zwiększeniu ć zbliża się do jedności. 
Wartości tej całki oblicza się za pomocą nieskończonej sumy: 


45 


á 1 - U S Bacy 
bw 2 yər toe 40 336 


É 2k41 


2 (2k +1) 


z ogólnym wyrazem (— 1)' 
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Za pomocą tabeli B podaną w końcu książki pola wycinków 
dadzą się łatwo i dokładnie obliczyć, odejmując odnośne war- 
tości funkcji Q (6). Pole wycinka ograniczonego przez wartości 
$ą 1 6, (6 > 6;) będzie równe Q (ć:) —Q (6,). i 

Trzeba w tym miejscu dla uniknięcia nieporozumień za- 
znaczyć z naciskiem, że zmienna ë (względnie x) funkcji de 
Moivre'a jest odpowiednikiem zmiennej ewentualnej, nato- 
miast zmienna 7 (względnie y) nie reprezentuje częstości — 
odpowiednikami częstości są pola wycinków krzywej, określone 
przez całkę Laplace'a. 

Co do zmiennej ¢ trzeba jeszcze dodać, że przybiera ona 
zarówno dodatnie jak i ujemne wartości, podczas gdy wartości 
zmiennej ewentualnej są zwykle podawane w formie liczb do- 
datnich. Wynika stąd pewna trudność przy porównywaniu 
szeregów rozdzielczych z funkcją de Moivrea, jak zresztą 
i z innymi funkcjami tego rodzaju. Trudność tę, jak zobaczymy 
poniżej, łatwo jest przezwyciężyć, przesuwając początek spół- 
rzędnych. 

Możemy teraz przystąpić do określenia średniej arytme- 
tycznej i momentów funkcji de Moivre'a. W ust. 10 mie- 
liśmy dla obliczenia średniej równanie (2) 

E f$ Xi 
. f: : 

Łatwo jest wykazać, że licznik tego wzoru w zastosowa- 
niu do funkcji de Moivrea równa się zeru. Istotnie niech 
będzie ABCD jakikolwiek wycinek po prawej stronie krzywej 
funkcji (ryc. 6). Pole jego będzie równe częstości dla klasy CD, 
względnie dla jej wartości środkowej, określonej przez środek 
odcinka CD. Dla każdego wycinka z figury krzywej można 
znaleźć symetrycznie po drugiej stronie krzywej podobny wy- 
cinek A'BC'D', którego pole będzie reprezentowało częstość 
dla klasy C'D' z taką samą wartością środkową, ale ujemną. 
Mnożąc pola tych wycinków przez + x w jednym przypadku, 
przez —x w drugim, otrzymamy jednakowe iloczyny, ale 


m = 
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o przeciwnych znakach. W ten sposób otrzymamy wartość zero 
dla Średniej arytmetycznej funkcji de Moivre'a. 


n 


<-ĘE x+ >» 


Ryc. 6 


Daleko bardziej zawiłe jest zagadnienie momentów. Dla 
obliczenia ich trzeba pole figury zakreślonej przez krzywą i oś 
odciętych rozbić gęsto ustawionymi rzędnymi na liczne wąskie 
wycinki. Trzeba następnie pola tych wycinków mnożyć przez 
odpowiednie potęgi odległości ich środków od rzędnej środko- 
wej, reprezentującej Średnią arytmetyczną. Trzeba wreszcie do- 
dać te iloczyny i podzielić otrzymaną sumę przez pole figury, 
która reprezentuje sumę częstości wszystkich klas wariantów. 
To dzielenie jest zresztą zbędne, bo wspomniane pole jest 
równe jedności. Im więcej będzie wycinków, im one będą skut- 
kiem tego węższe, tym dokładniejszy wypadnie wynik. Do- 
kładne wartości można otrzymać tylko za pomocą rachunku 
całkowego. 

Za pomocą tego rachunku otrzymuje się dla częściowych 
momentów pierwszego stopnia wartości: 


My 1 = z 


Rachunek całkowy daje dla momentu drugiego stopnia 
bardzo proste równanie m; = o*. Moment trzeciego stopnia jest 
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wobec symetrii krzywej równy zeru. Wreszcie moment czwar- 
tego stopnia równa się m, = 3 o. | 

Z tego wynika, że charakterystyczna dla funkcji de 
Moivre'a stała o jest średnim odchyleniem tej funkcji. Ozna- 
czenie jej tą samą grecką literą co odchylenie średnie jest za- 
tem bardzo celowe. Wynika następnie, że wskaźnik skośności 
jest równy zeru, a wskaźnik skupienia wariantów równy 3. 

Po tym długim, ale koniecznym wstępie przystępujemy 
do rozwiązania zagadnienia postawionego na początku ustępu. 
Chodzi o to, że szereg dwumianowy ze zwiększeniem n zbliża 
się do funkcji de Moivre'a. Przeprowadzenie ścisłego do- 
wodu jest niemożliwe bez rachunku nieskończonościowego. 
Nietrudno jest natomiast sprawdzić omawiane twierdzenie, 
porównując z tą funkcją poszczególne szeregi. Weźmiemy na- 
przykład szeregi (%2 + */:)*'i (4 + s)X, 

Porównanie, do którego przystępujemy, wymaga użycia 
dla szeregów dwumianowych i dla funkcji de Moivre'a tej 
samej zmiennej niezależnej. Funkcję weźmiemy w formie 


EAT — nie zawierającej stałej o. Zmienna ć jest, 
V2z 

. jak widzieliśmy, określona przez równanie x=o$. Ponieważ 

nadto początek tej zmiennej zbiega się ze średnią arytmetyczną 

funkcji, która jest równa zeru, wobec tego równanie określa- 

jące zmienną £ trzeba napisać w formie: 


x=mt oë. 


Ponieważ dla szeregów dwumianowych m=np, o — V npg, 
równanie powyższe przybierze formę: 
x = np +E j/npq 
skąd 
X A np 
Vnqp 


s 
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A więc dla szeregu ("2 + %)* będziemy mieli: 


SLA 
RR g—2 
V4X!/,X!/, 


dla szeregu zaś (72 + */s)": 
x —16X7/, 


5 Loeme e e am. 2 


/16X7],X1], 


Co się tyczy częstości w dwumianowych szeregach, nie 
trzeba będzie wprowadzać żadnych zmian, gdyż są to częstości 
względne, a więc suma ich równa się jedności, tak samo jak 
suma częstości w funkcji de Moivre'a formy o, 
W ujęciu graficznym znaczy to, że suma pól prostokątów 
w histogramie szeregu równa się polu figury zakreślonej przez 
krzywą funkcji i przez oś odciętych. 

Dla pierwszego z naszych szeregów otrzymamy w ten 
sposób zestawienie w tab. 25,2, dla drugiego w tab. 25,3. 


Tabela 25,2 
Szereg (1/2 +72): 


Zmienna ewen- 
tualna 


Częstości w 16-tych 


częściach jedności 


Dla porównania z funkcją œ. (£) trzeba będzie jeszcze 
przedstawić częstości w formie ułamków dziesiętnych a miano- 
wicie z czterema znakami, tak bowiem są obliczone wartości 
funkcji w tabelach, z których będziemy korzystali. 

Trzeba wreszcie obliczyć pola wycinków krzywej funkcji 
Y; ($) odpowiadające częstościom naszych szeregów dwumia- 
nowych, względnie prostokątom odnośnych histogramów. 


Tabela 25,3 
Szereg (72 + */2) * 
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Obliczenie pól wycinków 'z figury krzywej uskutecznimy 
za pomocą całki Laplace'a. Dla przeprowadzenia rachun- 
ków trzeba będzie wyznaczyć wartości zmiennej ¢ dla rzędnych 
ograniczających wycinki, inaczej mówiąc wartości tej zmiennej 
dla boków prostokątów histogramu. To zadanie sprowadza się 
do wyznaczania granic klasowych przedziałów, co było już 
rozpatrywane w ust. 5. 


Dla szeregu (7/2 + 1/2) * te granice będą: 
BE a a "—EMa OB. "LB. BE 


Dla nich z tabeli B w końcu książki znajdziemy wartości całki 
Laplace'a: 0.0063, 0.0668, 0.3085, 0.6915, 0.9332, 0.9937. - 

Odejmując te wartości kolejno od siebie, otrzymamy po- 
trzebne nam pola wycinków figury krzywej %,(£). Zestawiając 
je z częstościami szeregu, otrzymamy tabelę 25,4. Widzimy, 
że zgodność jest niezła mimo małej wartości n. 


Tabela 25,4 


Porównanie szeregu (72 + *:)* z całką Laplace'a. 
Całka Różnica 


0.0625 |. 0.0605 - | 0.0020 
0.2550 0.2417 | --0.0083 
0.3750 | 0.3830 | — 0.0080 
0.2500 | 0.2417 --0.0083 
0.0625 0.0605 | +0.0020 


Zgodność będzie lepsza dla szeregu (1/2 + 1/2)". Ponieważ 
ten szereg, tak samo zresztą jak i poprzedni, jest symetryczny, 
wystarczy rozpatrzyć połowę jego. Granice prostokątów będą 
kolejno — 4.25, — 3.75, — 8.25, — 2.75,... Otrzymamy zesta- 
wienie następujące. (tab. 25,5). 


Tabela 25,5 
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Porównanie szeregu (74 + '/:) * z całką Laplace'a. 


| | 
Szereg Całka | Róźnica 


0.0000 0.0001 —0.0001 
0.0002 0.0005 -0.0003 
0.0018 0.0024 —0.0006 
0.0085 0.0092 | —0.0007 
0.0278 0.0279 —0.0001 
0.0666 0.0656 0.0010 
0.1222 0.1200 0.0012 
0.1746 0.1747 -0.0000 
0.1964 0.1974 -0.0010 


Dla jeszcze wyższych potęg n zgodność będzie jeszcze 
lepsza. 

Porównanie szeregów dwumianowych z funkcją de 
Moivre'a przeprowadziliśmy powyżej za pomocą całki L a- 
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placea. Takie porównanie można także przeprowadzić bez- 
pośrednio. Pola prostokątów histogramu pozostaną w dalszym 
ciągu odpowiednikami pól z figury krzywej % (5). ale dla tych 
ostatnich pól będziemy brali wartości przybliżone, a to w spo- 
sób następujący. Przez środek każdego wycinka przeprowa- 
dzimy rzędną tzw. rzędną środkową (AD na ryc. 7) 
i pole wycinka przyrównamy polu prostokąta o tej samej pod- 
stawie z wysokością równą rzędnej Środkowej. Popełni się 
przytem pewien błąd, który będzie tym mniejszy, im wycinek 
będzie węższy. Rzędna środkowa będzie się cokolwiek różniła 
od wysokości odnośnego prostokąta hisogramu (CD na ryc. 7). 
znowu tym mniej, im wycinek i prostokąt będą węższe. Teraz 
mamy do porównania zamiast wycinka i prostokąta — dwa 
prostokąty. Ponieważ te prostokąty mają wspólną podstawę, 
można porównywać nie ich pola, lecz wysokości, to znaczy 
rzędną środkową z wysokością prostokąta histogramu. 


r 


Ryc. 7 


Dla przeprowadzenia tego porównania trzeba w wziąć pod 
uwagę, że przez wprowadzenie zmiennej ć zamiast pierwotnej x 
została wprowadzona nowa jednostka pomiarowa dla podstaw 
prostokątów histogramu. Ta jednostka jest tyle razy większa 
od jedności, ile razy o jest większe od jedności. Wynika to 
z równania zamiany zmiennej ć 21 n Wobec tego podstawy 


prostokątów wyrażają się teraz liczbami mniejszymi niż było 
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poprzednio w stosunku 1:0. Ażeby wielkość pól nie uległa 
zmianie, trzeba powiększyć w tym samym stosunku wysokości 
prostokątów, czyli pomnożyć częstości przez o. Jeżeli więc 
oznaczymy częstości w szeregach przez y, będziemy mieli 
równanie zamiany zmiennej w formie 7 = cy. Innymi słowami 
musimy tu wprowadzić zmienne normalne, takie, jakich uży- 
liśmy na początku ustępu dla funkcji de Moivrea. 

Ponieważ dla pierwszego z rozpatrywanych szeregów dwu- 
mianowych o= 1, częstości dla niego nie ulegną zmianie. Dla 
drugiego natomiast o = 2, wypadnie wobec tego podwoić często- 
ści. Biorąc z tabeli 25,1 wartości funkcji o (6), otrzymamy te- 
raz porównanie zestawione w tabelach 25,6 i 25,7. Porównanie 
znowu wypadło lepsze dla większego n. 


Tabela 25,6 


Porównanie szeregu (44 + 16) * z funkcją de Moivre'a. 
Szereg Funkcja Różnice 


0.0625 | 0.0540 --0.0085 
0.2500 | 0.2420 -+-0.0080 
0.3750 | 0.3989 —0.0239 


Tabela 25,7 


Porównanie szeregu (*/2 + "/2)" z funkcją de Moivreńa. 
Szereg Funkcja Różnice 


0.0000 | 0.0001 —0.0001 
0.0004 | 0.0009 —0.0005 
0.0036 | 0.0044 —0.0008 
0.0170 | 0.0175 —0.0005 
0.0556 | 0.0540 --0.0016 
0.1332 0.1295 --0.0037 
0.2444 0.2420 --0.0024 
0.3492 0.3521 ` —0.0029 
0.3938 0.3989 | —0.0001 
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Funkcja de Moivrea i wyprowadzona z niej całka 
Laplace'a mają wielkie znaczenie w statystyce. Pochodzi to 
stąd, że liczne szeregi rozdzielcze mają rozdział częstości zbli- 
żony do szeregu liczb, jakie otrzymuje się dla pól wycinków 
krzywej de Moivre'a za pomocą całki Laplace'a. Mówi 
się o takich szeregach, że mają normalny rozkład 
częstości albo że mają formę normalną. Już na oko 
widoczne to jest z przykładów przytoczonych w ust. 6. Do- 
kładnie ta kwestia będzie omówiona w rozdziale VI. Jeszcze 
ważniejszym jest zastosowanie tej funkcji przy ocenie wiaro- 
godności charakterystyk, co będzie tematem rozdziału V. 


26. Szereg Poissona i jego charakterystyki. Widzieliśmy 
w ust. 28, że szereg dwumianowy wypada skośny, jeżeli p — 
prawdopodobieństwo zdarzenia — jest małe. Jeżeli jest bardzo 
małe, szereg staje się jednobocznym. Zwiększenie n, liczby 
przypadków w zbiorach, pomniejsza skośność. 

Opierając się na powyższych zasadach, rozpatrzmy teraz 
zagadnienie powtarzania się zdarzenia, kiedy jego prawdopo- 
dobieństwo jest bardzo małe, a zbiory przypadków są bardzo 
duże. Przy takim założeniu iloczyn A=np oczywiście może 
mieć różne wartości, na ogół jednak ani zbyt duże, ani zbyt 
małe. Jaka będzie wtedy forma szeregu dwumianowego? 

Otóż można dowieść, że będzie on miał formę zbliżoną do 
wzoru ustalonego przez francuskiego matematyka Poissona: 
ASY A” 


E A 35 pe 


Z tego szeregu pierwszy wyraz, to znaczy e” daje praw- 
dopodobieństwo niewystąpienia zdarzenia, drugi wyraz czyli 
-) 


gk (1 zE 
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krotnego wystąpienia itd. Suma tych wyrazów jest równa 


rzenia, trzeci a więc 


x X Pe A? 
; śni B 2 as AE Alis 
jedności, gdyż suma wyrazów szeregu 1 GE Metsa! BR OAŚ 


§ 26 127 


jest = =, Pod tym względem szereg Poissona jest po- 
dobny do szeregu dwumianowego oraz do całki Laplace'a. 

Nietrudno jest przekonać się, że jeżeli A jest mniejsze od 
jedności, to wyrazy szeregu będą malały. Naprzykład przy 
4=0.5 wypadnie (w tysiącznych): 


607, 303, 76, 13, 2,... 


Przy 4=1 pierwsze dwa wyrazy będą największe i będą 
sobie równe a dalsze coraz mniejsze: 368, 368, 184, 61, 15, 3;... 
Przy A > 1 będą one z początku wzrastały a potem malały. Na- 
przykład przy 4=2 będziemy mieli (zawsze w tysięcznych 
częściach jedności): 135, 271, 271, 180, 90, 36;... 

Widzimy w tym ostatnim przykładzie, że w nim tak samo 
jak w poprzednim dwa wyrazy są jednakowe, tylko nie pierw- 
szy i drugi, lecz drugi i trzeci. Przy całkowitych wartościach ź 
zawsze dwa kolejne wyrazy wypadną jednakowe. Będą to wy- 
razy największe. Tego nie będzie przy niecałkowitych warto- 
ściach /, naprzykład przy 4 =2.5 otrzymamy szereg: 82, 205. 
257, 214, 134, 67,... 

Szereg Poissona jest nieskończony, ale z niego trzeba 
wziąć tylko n + 1 wyrazów, tyle ma ich bowiem szereg dwu- 
mianowy. Stąd wynika pewna niezgodność między tymi szere- 
gami. Ponieważ jednak wyrazy szeregu Poissona maleją 
bardzo szybko, a liczba n jest bardzo duża, różnica między 
omawianymi szeregami jest minimalna, co można łatwo spraw- 
dzić. 

I tak przypuśćmy, że prawdopodobieństwo pewnego zda- 
rzenia jest jedna setna a zbiory liczą po sto przypadków. 
Będziemy wtedy mieli 2 = np = 1 i szereg Poissona przy- 
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Odpowiedni szereg dwumianowy będzie następujący: 
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wynik następujący w tysięcznych częściach jedności (tab. 26,1). 


Tabela 26,1 


Szereg | Szereg 


s k Różnica 
Poissona | dwumianowy 
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Zgodność wypadła doskonała. 


Trzeba jeszcze obliczyć średnią arytmetyczną i momenty 
dla szeregu Poissona. Dla obliczenia tych charakterystyk 
weźmiemy za wartość wyjściową zero. Dla średniej arytme- 
tycznej będziemy mieli (tab. 26, 2). Sumowanie iloczynów fæ 


3 ; : =N 
da nam po wyprowadzeniu za nawias czynnika łe ^: 


E WAĆ RRS, 


ufa le "++ 


Ponieważ suma szeregu stojącego w nawiasach wynosi R ; 
suma odchyleń będzie równa /. Taką samą wartość będzie miał 
pomocniczy moment u, gdyż suma f równa się. jedności. Ponie- 
waż średnia arytmetyczna równa się u, przy wartości wyjścio- 
wej zero, będzie ona także równa A. 


Tabela 26,2 


| ji 
Liczby y ; 
Er a Częstość względna 
Baia tych liczb 


Momentów pierwszego stopnia nie można określić w ogól- 
nej formie dla tych samych powodów, jak dla szeregu dwu- 
mianowego. Natomiast moment drugiego stopnia da się obli- 
czyć z łatwością tą samą metodą. Będziemy mieli według ze- 
stawienia tabeli 26,3: 
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Wydzielając z wielomianu stojącego w nawiasach wielomian 


=le"" (e^ +r) =+ 


Stąd wypadnie m, = p — vi =h +A 


Zadania i metody statystyki 


130 
W podobny sposób można wyprowadzić wzory dla mo- 


mentów trzeciego i czwartego stopnia: m; =Å, m,=4 "3%. 


Tabela 26,3 
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Szereg Poissona jest bardzo pożyteczny przy opraco- 
wywaniu jednobocznych szeregów rozdzielczych. 


ROZDZIAŁ V. 


WIARYGODNOŚĆ CHARAKTERYSTYK MATERIAŁÓW 
STATYSTYCZNYCH. 


27. Istota zagadnienia wiarogodności charakterystyk. Omó- 
wione w rozdziałach lI i III charakterystyki materiałów staty- 
stycznych były ustalone bez względu na to czy te materiały 
obejmowały całą populację, czy też stanowiły jej część. Otóż 
zdarza się tylko wyjątkowo, żeby opracowywano w całości 


materiał jakiegoś zagadnienia, nawet jeżeli jest on ograniczony 
i dostępny, jak na przykład spis ludności. Prawie zawsze bierze 
się z populacji tylko niewielką jej część, wybraną umyśl- 
nie w sposób przypadkowy i na podstawie tej tak 
zwanej próby sądzi się o całości populacji. Naturalnie tylko 
wyjątkowo może się zdarzyć, że próba jest w zupełności po- 
dobna do populacji. Stajemy więc wobec niezmiernie ważnego 
zagadnienia — w jakim'stopniu próba jest podobna do populacji. 
'W tłumaczeniu na język statystyki będzie to równoważne z py- 
taniem, w jakim stopniu charakterystyki próby 
zbliżają się do takich samych charakterystyk 
całości populacji. Jest to zagadnienie wiarogodno- 
ści tych charakterystyk. ? 

Bezpośredniej odpowiedzi na powyższe pytanie dać nie 
można. Byłoby to bowiem równoznaczne z dokładną charak- 
terystyką populacji według próby, co jest niemożliwe. Można 
tylko ustalić, jaka część wszelkich możliwych 
prób ma taką czy inną zgodność z populacją. 


9* 
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Inaczej można powiedzieć posługując się językiem nauki 
o prawdopodobieństwie, że określenie wiarogodności 
charakterystyk może polegać tylko na ustale- 
niu prawdopodobieństwa takiego lub innego 
stopnia zgodności między próbą a populacją. 

Trzeba zaraz na wstępie zaznaczyć, że pojęcie prawdopodo- 
„bieństwa będzie tu odmienne od podanego w poprzednim roz- 
dziale. Różnica nie jest zasadnicza, — inaczej nie można by było 
używać tego samego terminu. I tu i tam chodzi o częstość zda- 
rzeń, o ile ona jest powodowana przez określone przyczyny. 
Ale przyczyny określone sprowadzają się teraz do jednej 
tylko — tej samej we wszystkich zagadnieniach — do składu 
populacji. I to jeszcze nie jest rzecz główna — ta przyczyna 
jest zawsze okryta tajemnicą, podczas gdy w nauce o prawdo- 
podobieństwie przyczyny określone były znane. Tam mogliśmy 
za pomocą kombinatoryki z tych przyczyn wyprowadzić licz- 
bową wartość prawdopodobieństwa. Tu jest to niemożliwe. 
Mamy tu prawdopodobieństwo osobliwego rodzaju — praw- 
dopodobieństwo statystyczne. 

A więc stajemy przed zadaniem nierozwiązalnym — po- 
wie czytelnik. I tak, i nie. Zadanie da się rozwiązać częściowo 
a to w sposób następujący. Zakładamy, że populacja ma taki 
a taki skład i badamy, jak się będą przedstawiały wszelkie moż- 
liwe próby, jakie z niej można otrzymać. Ustalamy tą drogą 
związki zachodzące między populacją a ogółem prób. Poznaw- 
szy te związki, będziemy mogli w pewnej mierze sądzić o nie- 
znanym charakterze populacji według wziętych z niej prób. 
Zazwyczaj zakłada się, że populacja ma charakter normalny. 
Dodatkowo bada się, o ile odchylenia od tego charakteru wpły- 
wają na związek między populacją a próbami. 

Z powyższego wypływa, że w zagadnieniach wiarogodności 
charakterystyk prowadzi się rozumowania tymi samymi meto- 
dami co w nauce o prawdopodobieństwie. Stąd też jej podsta- 
wowe twierdzenia, w szczególności twierdzenie o prawdopodo- 
bieństwie całkowitym i złożonym, zachowują swoją ważność. 
Można by nawet ogólne pojęcie prawdopodobieństwa ująć w spo- 
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sób statystyczny. Można mianowicie rozpatrywane zbiory zda- 
rzeń traktować jako próby wyjęte z pewnego rodzaju populacji 
obejmującej wszystkie możliwe zbiory danych zdarzeń. Wtedy 
ilościowe określenie prawdopodokieństwa sprowadziłoby się po 
prostu do względnej częstości zdarzenia w takiej populacji. Tak 
też traktuje się prawdopodobieństwo w statystyce. O ile się 
w niej mówi o prawdopodobieństwie, chodzi po prostu o wzglę- 
dną częstość w populacji. Trzeba przy tym operować uważnie 
takimi pojęciami, mianowicie trzeba uważać na to, by nie po- 
mieszać populacji z próbą. Częstość względna wariantów 
w próbie nie może być uważana za żaden rodzaj prawdopodo- 
bieństwa. 


W związku z powyższym trzeba jeszcze bliżej określić po- 
jęcie próby. Traktowaliśmy ją jako część populacji. Takie okre- 
ślenie jest niedostateczne. Dotyczy ono jednej tylko odmiany 
` omawianego pojęcia — próby bez powtórzeń. A jest 
jeszcze druga odmiana: próba z powtórzeniami. 


O co tu chodzi? Jeżeli próba ma być częścią populacji, to 
wszystkie zawarte w niej warianty muszą być różne. Niektóre 
z nich mogą być jednakowe, ale nie te same. Na przykład je- 
żeli z urny zawierającej białe i czarne kule wybierzemy część 
ich, powiedzmy dziesięć, to może w niej być sześć jednakowych 
czarnych kul i cztery jednakowe białe, ale będą to kule różne. 
Można jednak utworzyć próbę w inny sposób. Można miano- 
wicie wziąć z urny jedną kulę, zanotować jej barwę i włożyć 
ją z powrotem. Następnie po wymieszaniu można wziąć — 
zawsze na chybi trafi — znowu jedną z kul i po zanotowaniu jej 
barwy włożyć ją z powrotem do urny. Powtarzając tę czyn- 
ność dziesięć razy, możemy otrzymać próbę złożoną także z sze- 
ściu czarnych i czterech białych kul, ale o innym charakterze. 
W niej mogą się spotkać kule nietylko podobne ale i iden- 
tyczne — może się przecież zdarzyć, że wyciągniemy tę samą 
kulę nawet wielokrotnie. Będzie to próba z powtórzeniami. Na- 
tomiast wyjęcie dziesięciu kul z urny bez wkładania ich z po- 
wrotem da próbę bez powtórzeń. 
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W praktyce statystycznej ma się do czynienia zwykle z pró- 
bami bez powtórzeń. Istotnie, jeżeli na przykład liczy się kwiaty 
w koszykach bławatka, to bierze się coraz inny koszyk, albo 
jeżeli mierzy się wzrost poborowych, to ma się do czynienia 
z coraz to innym osobnikiem. Jednakże przy wielkich w po- 
równaniu z próbami populacjach, a tym bardziej przy nieogra- 
niczonych, branie prób bez powtórzeń daje ten sam wynik co 
z powtórzeniami. Istotnie usuwa się przy tym pewne warianty 
z populacji, ale wobec wielkiej ich ilości skład populacji za- 
chowuje prawie ten sam charakter przy ograniczonym jej za- 
kresie i dokładnie ten sam przy nieograniczonym. Jest wtedy 
bardzo mało prawdopodobne, by usunięcie z populacji składni- 
ków jednej próby miało wpłynąć na skład dalszych prób. 

Zagadnienia, które będziemy omawiali w tym rozdziale, 
muszą być traktowane inaczej przy próbach z powtórzeniami, 
aniżeli przy próbach bez powtórzeń. Rozumowania i wyniki 
w pierwszym przypadku są o wiele prostsze, a ponieważ w prak- 
tyce różnica między jednym a drugim rodzajem prób zaciera 
się, będziemy uważali, że rozpatrywane próby są brane z pow- 
tórzeniami, jakkolwiek w rzeczywistości jest odwrotnie. 

W dalszych ustępach będziemy badali przedstawione tu 
zagadnienie wiarogodności. Jest to zadanie zawiłe i trudne. 
Trzeba będzie rozwiązywać je stopniowo, przy czym wypadnie 
wprowadzać nowe pojęcia i stosować naukę o prawdopodo- 
bieństwie. Narazie można powiedzieć ogólnie, że im próba jest 
większa, tym bardziej zbliża się swoim charakterem do popu- 
lacji, ale niekoniecznie. Przypadek może zrządzić, że właśnie 
wielka próba będzie się różniła silnie od populacji. Trafia się to 
tym rzadziej, im próba jest większa, ale trafić się może zawsze. 

Zwiększenie zakresu prób nie rozwiązuje zatem kwestii. 
Nadto otrzymywanie wielkich prób jest trudne i często nawet 
praktycznie niewykonalne. Nieraz wypada pracować z próbami 
po kilka wariantów zaledwie, jak to jest prawidłem w doświad- 
czalnictwie rolniczym. Zagadnienie małych prób ma przeto 
szczególne znaczenie w statystyce i będzie omówione osobno 
w ustępie 31. 
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28. Populacje charakterystyk. Z wywodów poprzedniego 
ustępu wynika, że zagadnienie wiarogodności charakterystyk 
materiałów statystycznych wymaga zbadania ogółu prób, jakie 
mogą być otrzymane z: populacji. Każda próba ma swoje cha- 
rakterystyki: średnią, momenty itd. Możemy wobec tego utwo- 
rzyć dla każdej charakterystyki osobne populacje, tzw. 
wtórne, złożone z wartości charakterystyk poszczególnych 
prób. Dla uniknięcia nieporozumień można populację, z której 
się one wywodzą, nazywać pierwotną. Populacje wtórne są 
zawsze nieograniczone, nawet jeżeli populacja pierwotna jest . 
ograniczona. Można bowiem bez końca wybierać próby z popu- 
lacji, jak kule z urny, jeżeli się je wkłada z powrotem. Będą to 
naturalnie próby z powtórzeniami. 

Populacje wtórne mają swoje charakterystyki, jak każda 
populacja. Nadano im groteskową nazwę „nadziei matematycz- 
nych”. A więc przede wszystkim będziemy mieli średnią aryt- 
metyczną, która odgrywa szczególnie ważną rolę. 

Dalej ważną charakterystyką wtórnych populacji jest mo- 
ment drugiego stopnia; względnie średnie odchylenie, będące 
pierwiastkiem kwadratowym z tego momentu. Stwarza on pod- 
stawę do obliczenia tak zwanego średniego błędu, któ- 
rym są obciążone charakterystyki prób. 

Wreszcie nie można pominąć momentów trzeciego i czwar- 
tego stopnia, względnie wyprowadzanych z nich pochodnych 
charakterystyk — skośności i ekscesu. Co do tych ostatnich za- 
chodzi rzecz wielkiej wagi: przyzwiększeniuzakresu 
prób skośność i eksces populacji wtórnych 
zmierzają do zera. To znaczy, żeprzy zwiększeniu 
zakresu prób populacje wtórne zbliżają się do 
formy normalnej. Trudności matematyczne nie pozwalają 
podać dowodu tego podstawowego twierdzenia. Można jednak 
dla wyjaśnienia istoty zagadnienia sprawdzić je na konkretnych 
przykładach. Zróbmy to dla średniej arytmetycznej. 

Pierwszym takim przykładem będzie bardzo prosta popu- 
lacja złożona z 5 wariantów: 1, 2, 3, 4, 5. Weźmiemy z niej 
próby po trzy warianty naturalnie z powtórzeniami i rozpa- 
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dla tych prób. Pomimo nieograniczności tej popupalcji możemy 


ustalić jej skład. Istotnie łatwo jest ustalić listę równie praw- 


dopodobnych spotkań wariantów przy wybieraniu prób. Będzie 
to lista obejmująca 5°= 125 takich spotkań (tab. 28,1). 


Tabela 28,1 
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W tej liście część prób różni się między sobą tylko porząd- 
kiem wariantów. Zbierając razem podobne próby, otrzymamy 
35 rodzajów ich. Częstość tych rodzajów jest częściowo różna. 
Nietrudno jest ustalić te częstości. Będziemy mieli nową listę 
prób z częstościami względnymi w 125-tych częściach jedności 
(tab. 28,2). Te częstości będą oczywiście niczym innym, jak 
prawdopodobieństwami statystycznymi. We wspomnianej ta- 
beli są podane oprócz tych prawdopodobieństw średnie arytme- 
tyczne wyrażone w trzecich częściach jedności. Na podstawie 
tych danych można teraz ułożyć szereg rozdzielczy wtórnej 
populacji, złożonej ze średnich dla prób (tab. 28,3). 

Szereg ten wypadł symetryczny — tak jest zawsze, jeżeli 
populacja wtórna wywodzi się z populacji symetrycznej. Co się 
zaś tyczy ekscesu, to wypada on ujemny i równa się —0.538. 
Widzimy, że rozpatrywana populacja nie odbiega zbytnio od 
normalnej. 


Tabela 28,2 


Rodzaje prób Ich prawdopodo- Ich średne 
bieństwa w '/12 w 3 
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Rodzaje prób Ich prawdopodo- Ich średnie 
| bieństwa w */425 w i 
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Ale tego jest mało. Trzeba wziąć próby większe. 


Weźmiemy w tym celu inną populację, umyślnie silnie 
asymetryczną, nawet jednoboczną. Skład jej będzie następu- 
jący: 50% wariantów z wartością 1, 30 % wariantów z war- 
tością 2 i 20% wariantów 3. Inaczej można powiedzieć, że 
statystyczne prawdopodobieństwo wariantów 1 jest 0.5, warian- 
tów 2 jest 0.3 i wariantów 3 jest 0.2. 


Tabela 28,3 


Średnie prób Ich prawdopodobieństwa 
w "fg w "125 
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Weźmiemy z początku próby po 3 warianty, tak jak po- 
przednio. Będziemy mieli tylko 10 rodzajów prób: 111, 112, 113, 
122, 123, 138, 222, 223, 233, 338. Częstości względne tych rodza- 
jów prób, inaczej mówiąc ich prawdopodobieństwa statystycz- 
ne, są różne. Dadzą się one obliczyć z łatwością według uogól- 
nionego dwumianu Newtona (ust. 23). Będziemy mieli praw- 
dopodobieństwa (tab. 28,4). 


Tabela 28,4 
Prawdopodobieństwa 
3! 
310!0! 


3! 
2!1!0! 


dla prób 111 X 0.5? x 0.3” X 0.27” = 0.125 


LI 2 x 0.5? x 0.8* x 0.2 = 0.225 


3! 


arorii X 0:57 X 0-3" X 0.2" =0.150 


X 0.5' X 0.3? X 0.2” =0.135 


miri X 05! X 0.3: X 0.2! = 0.180 


1!0f2! 
3! 


133 X 0.5! X 0.37 X 0.22 == 0.060 


3! 
0!2!1! 
! 


0!1!2! 


228 X 0.59 X 0.3? X 0.27 = 0.054 


233 Xx 0.5” X 0.3! X 0.2? = 0.036 


3i 
» 388 qqargi X 05 X 0.3" X 0.2° = 0.008 


Na tej podstawie możemy ułożyć szereg rozdzielczy śred- 
nich dla prób trójkowych (tab. 28,5). Wypadł szereg wyraźnie 
skośny. 


Tabela 28,5 


Próby trójkowe 


my me 


Srednie Ich prawdopodobieństwa 
w 8 


0.125 
0.225 
0.285 
0.207 
0.114 
0.036 
0.008 
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Układając tą samą metodą szeregi dla prób większych — 
czwórkowych, piątkowych i szóstkowych — otrzymamy sze- 
regi mniej skośne, pomimo skrajnej skośności rozpatrywanej 
pierwotnej populacji (tab. 28,6—8). 


Tabela 28,6 
Próby czwórkowe 


Średnie , Ich prawdopodobieństwa 
w 4 


0.0625 
0.1500 
0.2350 
0.2340 
0.1761 
0.0936 
0.0376 
0.0096 
0.0016 


Tabela 28,7 


Próby piątkowe 


Średnie Ich prawdopodobieństwa 
w 5 


0.03125 
0.09375 
0.17500 
0.21750 
0.20525 
0.14643 
0.08210 


Ich prawdopodobieństwa 


0.03480 
0.01120 
0.00240 
0.00032 


Tabela 28,8 
Próby szóstkowe 


Średnie Ich prawdopodobieństwa 
w '/6 


0.015625 
0.056250 
0.121875 
0.180000 
0.202875 
0.178290 
0.126029 
0.071316 
0.032460 
0.011520 
0.003120 
0.000576 
0.000064 


Porównajmy ostatni, szóstkowy, z tych szeregów z krzywa 
normalną. Weźmiemy do tego cztery znaki dziesiętne zamiast 
wszystkich sześciu w wartościach prawdopodobieństw. Obliczmy 
odchylenie średnie. Otrzymamy © = 1.9136, wyrażone w '/6 jako 
jednostce. Stąd wyprowadzimy za pomocą całki Laplace'a 
następujące porównanie populacji z krzywą normalną (tab. 28.9). 


U 
Tabela 28,9 


Próby szóstkowe 


Średnie | Ich prawdopodo- Wartości krzywej Różnie 
bieństwa w 1/10000 normalnej w */10000 swą 


156 198 —42 
562 | 525 +87 
1219 | 1074 +145 
1800 | 1690 +10 
2029 | 2079 —50 
1783 | 1881 —98 
1260 | 1371 —111 
713 685 +28 
325 305 +20 
115 | 94 +21 
31 | 23 +8 

6 | 4 +2 

È | 1 0 


Widzimy, że zgodność wypadła niezła, jakkolwiek próby 
nie były duże. 


29. Nadzieja matematyczna, Jak to było podane w poprzed- 
nim ustępie, nadzieja matematyczna takiej czy 
innej- charakterystyki jest to średnia aryt- 
metyczna wartości danej charakterystyki 
dla ogółu prób wziętych z danej populacji, 
inaczej mówiąc, średnia arytmetyczna odnośnej 
wtórnej populacji. Oznacza się ją literą E (espérance) 
z podaniem w nawiasach symbolu odnośnej charakterystyki. 
A więc na przykład E (m) jest nadzieją matematyczną średniej 
arytmetycznej. 

Znaczenie nadzieji matematycznej wynika stąd, że daje 
ona pewne pojęcie o wartości charakterystyk dla populacji, daje 
nadzieję bliższego oznaczenia takich charakterystyk na pod- 
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stawie prób z populacji skietych: Jak każda nadzieja, jest ona 
złudna i zbyt wiele od niej spodziewać się nie można. Sprawa 
przedstawia się w sposób następujący. Charakterystyki nieogra- 
niczonej populacji nie mogą być obliczone bezpośrednio. Chce- 
my jednak je ustalić przynajmniej w przybliżeniu. Otóż dla 
każdej charakterystyki populacji można ustalić zupełnie do- 
kładnie, za pomocą równania, związek jej z odnośną nadzieją 
matematyczną. Zadanie sprowadza się zatem do obliczenia tej 
nadzieji. Ponieważ jest to Średnia arytmetyczna wartości cha- 
rakterystyki dla prób, można ją obliczyć z dowolną dokładno- 
ścią, jeżeli się weźmie tych prób dostatecznie dużo. W praktyce 
sprawa przedstawia się jednak niekorzystnie, gdyż ma się zwy- 
kle jedną tylko próbę. Widoki należytego rozwiązania popra- 
wiają się, jeżeli próba jest duża, ale zasadnicza niepewność po- 
zostaje, gdyż można przypadkowo natrafić na próbę znacznie 
różniącą się od populacji. Im próba jest większa, tym rzadziej 
taki „pech” wystąpi. 

Rozpatrzmy nadzieje matematyczne poszczególnych cha- 
rakterystyk, Wartości charakterystyk dla prób będziemy ozna- 
czali małymi literami, tak jak dotąd, natomiast ich wartości dla 
populacji — przez odnośne duże litery, na przykład średnią 
arytmetyczną próby będziemy oznaczali przez m, Średnią zaś 
populacji przez M. Będziemy mieli tu do czynienia z równania- 
mi, których wyprowadzenie jest bardzo zawiłe. To też muszę 
ograniczyć się do podania tych równań i sprawdzenia ich waż- 
ności na przykładach. 

Najprościej przedstawia się rozpatrywane zagadnienie dla 
średniej. arytmetycznej: nadzieja matematyczna 
średniej równa się średniej dla populacji: 
E (m) = M. Nie trudno jest sprawdzić to twierdzenie na przy- 
kładach poprzedniego ustępu. Dla populacji 1, 2, 3, 4, 5 M = 3. 
Ż podanego w tabeli 28,3 szeregu rozdzielczego Średnich dla 
ogółu prób wynika nawet bez obliczeń taka sama wartość. 

Dla drugiej z rozpatrywanych w poprzednim ustępie po- 
pulacyj M = 1.7. Obliczmy Średnią dla wtórnej populacji zło- 
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żonej z trójkowych prób. Na podstawie danych tabeli 28,5 otrzy- 
mamy: 
Nic 

E(m)= ZĘ =1[,(3 X 0.125 + 4 X 0.225 +-5 X 0.285 + 

-+6 X 0.207 +7 X 0.114--8 X 0.086 -- 9 X 0.008) : (0.125 -| 

+ 0.225 ~- 0.285 -} 0.207 -++ 0.114 + 0.036 -+ 0.008) = 

= 1/, (0.375-- 0.900 -- 1.425 -+ 1.242 —- 0.798 -+ 0.288 -+ 

-+ 0.022) = !/, X 5.100.= 1.7 = M 


Czytelnik może łatwo przekonać się, że taki sam wynik 
dadzą wtótne populacje większych prób tej populacji. 
Przechodzimy do momentu drugiego stopnia. Tu nadzieja 
matematyczna nie będzie równa wartości tego momentu dla po- 
pulacji. Będzie mianowicie trochę za mała: 
yno keak mę "A 


n 


W tym równaniu n, jak zawsze, jest liczbą wariantów w próbie. 

Łatwo jest sprawdzić to równanie na konkretnym przy- 
kładzie, np. na populacji 1, 2, 3, 4,5. Dla niej M, = 2. Obliczmy 
nadzieję matematyczną według danych tabeli 28,2. Tabele 29,1 
i 29,2 dają przebieg obliczeń. 


Tabela 29,1 


Ich prawdo- | Ich momen- | Ich prawdo- | Ich momen- 
podobień- ty drugiego |] Rodzaje ty drugiego 


ż stopnia st stopnia 
stwa w '/125 PR 
U 


Rodzaje 
prób 


| podobień- 
| stwa w '/125 w '/27 


| 24 
42 
72 
54 
78 
96 
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6 
24 
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Zadania i metody statystyki 


5 29 


Ich prawdo- | Ich momen- : Ich prawdo- | Ich m men- 
| „.„. |ty drugiego Rodzaje A PM ty drugiego 
podobień- i. j podobień- E Ag 
| stopnia prób stopnia 
| stwa w '/125| w 1/125 stwa w 1/125 w '/27 


Rodzaje 
prób 
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Tabela 29,2 


Wartości momen- Ich prawdo- Wartości momen- Ich prawdo- 
tów drugiego podobieństwa tów drugiego podobieństwa 
stopnia w '/27 w 1/125 stopnia w */27 w 1/125 


0 12 
6 6 
18 12 
24 6 
42 


Wypadnie ostatecznie średnia arytmetyczna wtórnej popu- 
. lacji złożonej z momentów drugiego stopnia dla prób: 


Efm) = -3-. 


podczas gdy moment drugiego stopnia dla pierwotnej populacji 
wynosi M, = 2. Ponieważ n w tym wypadku równa się 3, więc 
zgodnie z rozpatrywanym równaniem otrzymamy: 
3-71 4 
SUB SA9 e LE 
3 > 3 

Z powyższego wynika prawidło do obliczenia momentów 
drugiego stopnia dla prób. Zamiast tego, żeby dzielić sumę kwa- 


E(m,) = 
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dratów odchyleń przez liczbę wariantów, trzeba ją dzielić przez 
liczbę o jedynkę mniejszą według wzoru 


ke! 5 (u — u) 


m, 
J n—1 


W ten sposób otrzymuje się wartości bliższe wartości tego 
momentu dla populacji. Naturalnie ma to znaczenie tylko przy 
małych próbach, ale z takimi próbami właśnie wypada często 
pracować. 

Obliczenie średniego odchylenia dla prób ulegnie odpowie- 
dniej zmianie. Dla uniknięcia nieporozumień dobrze jest otrzy- 
mane tą zmienioną metodą wartości oznaczać nie grecką literą o 
lecz odnośną łacińską s 


Nadzieje matematyczne momentów wyższych stopni rów- 
nież nie są równe wartościom tych momentów dla populacji. 
Mianowicie mamy dla nich równania 


AA |? 
+ (m= 1) (n FAB 2) (n — 3) 


(n— 1) (2n — 
n’ 3 


E(m,) = Moea 


3) M, +3M 


Te równania nie mają praktycznego znaczenia. 


30. Błąd średni i prawdopodobny. Wywody poprzednich ustę- 
pów miały charakter wstępu do właściwego zagadnienia wiaro- 
godności charakterystyk. Rozwiązanie tego zagadnienia może 
być częściowo przeprowadzone za pomocą pojęcia błędu 
średniego. Błędem średnim charakterystyki 
nazywa się Średnie odchylenie dla odnośnej 
wtórnej populacji. Otóż było podane w ustępie 28, że 
takie populacje zbliżają się szybko do formy normalnej przy 
powiększeniu zakresu prób. Normalny zaś rozkład częstości 
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ma tẹ właściwość, że blisko dwie trzecie czestości, dokładniej mó- 
wiąc część 0.6826 całości, mieści się w przedziale między ujemną 
a dodatnią wartością średniego odchylenia. Widoczne to jest 
z całki Laplace'a (zob. tabelę B podaną w końcu książki). 
Można zatem powiedzieć, że średni błąd danej charak- 
terystyki określa w przybliżeniu granice, 
w których mieszczą się w dwóch przypadkach 
na trzy odchylenia tego rodzaju charaktery- 
styk dla prób od ich średniej czyli od nadziei 
matematycznej danej charakterystyki. Wi- 
dzieliśmy nadto w poprzednim ustępie, że nadzieja matema- 
tyczna jest zbliżona do wartości danej charakterystyki dla po- 
pulacji, a w przypadku średniej arytmetycznej nawet jej równa. 
Wobec tego można powiedzieć, że średni błąd danej cha- 
rakterystyki określa w przybliżeniu granice, 
w których mieszczą się w dwóch przypadkach 
na trzy odchylenia tego rodzaju charaktery- 
styk dla prób od wartości danej charaktery- 
styki dla populacji. 

Średni błąd oznacza się grecką literą £ z podaniem sym- 
bolu odnośnej charakterystyki w nawiasach, np. średni błąd 
średniej arytmetycznej oznacza się symbolem € (m). Wartość 
średniego błędu dodaje się zwykle do wartości charakterystyki 
ze znakiem +, np. pisze się m + e (m). 

Najprościej przedstawia się rozpatrywane zagadnienie dla 
średniej arytmetycznej; mianowicie można dowieść, że śre- 
dnie odchylenie wtórnej populacji złożonej 
ze średnich dla prób równa się śŚredniemu od- 
chyleniu populacji pierwotnej podzielonemu 
przez pierwiastek kwadratowy z wielkości 
próby. 

Istotnie widzieliśmy, że populacja 1, 2, 3, 4, 5 miała moment 
drugiego stopnia równy dwa, a więc średnie odchylenie y2. 
Obliczmy moment drugiego stopnia dla wtórnej populacji zło- 
żonej ze średnich dla trójkowych prób według danych tabeli 
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ę 2 

28,3. Otrzymamy wartość równą 3 , a więc średnie odchylenie 
ż: 

równe V $ zgodnie z podanym powyżej twierdzeniem. 


Będziemy zatem mieli dlą obliczenia średniego błędu śre- 


S ù 
dniej arytmetycznej wzór € (m) = —= , gdzie S jest średnim 
yn 


odchyleniem dla populacji, a n liczbą wariantów w próbach. 
W praktycznym wykonaniu obliczenia będzie się miało trudność, 
wynikającą stąd, że dokładne wartości charakterystyk populacji 
nie są znane. Otóż widzieliśmy w ustępie poprzednim, że wiel- 
Ye 

kość s = yy S jest zbliżona do wielkości S. Wobec tego tę 
ostatnią wielkość używa się zamiast S przy obliczaniu średniego 
błędu średniej arytmetycznej, tak samo zresztą jak we wszyst- 
kich innych przypadkach, w których ma się do czynienia ze 
średnim odchyleniem dla populacji. 

Zanim przejdziemy do rozpatrzenia średniego błędu innych 
charakterystyk, warto jest mimochodem rozpatrzyć stosowane 
czasem zamiast średniego błędu pojęcie błędu prawdopodobnego. 
Odznacza się on tym,że odchylenia wartości charak- 
terystyki dla prób od jej nadziei matematycz- 
nej wypadają równie często większe jak 
i mniejsze od niego. Z całki Laplace'a wynika, że 
błąd prawdopodobny, jest mniejszy od średniego w stosunku 
0.67449... do 1. Użycie tej wielkości nie daje żadnych korzyści 
większych od użycia błędu średniego. 

Równania średniego błędu dla innych charakterystyk są na- 
ogół bardziej złożone. I tak średni błąd momentu drugiego sto- 
pnia wyraża się wzorem: 


(MME 
ACA EZ a= rrt AA 
(m,) y n 
a średni błąd odchylenia średniego: 


c” KBZEA 
E (a) === S y PEA , 
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gdzie B jest wskaźnikiem skupienia wariantów w populacji. 
Przy użyciu ekscesu zamiast wskaźnika skupienia wariantów 
wzór przybierze formę: 


gdzie l, jest ekscesem dla populacji. 


Dla populacji niezbyt odbiegających od formy normalnej 
eksces jest mały. Można go przyrównać zeru i wtedy wzór ulega 
uproszczeniu: 


s 


s (0) = ——— 
©) V2n 
Zagadnienie średniego błędu dla odchylenia przeciętnego 
jest bardziej zawiłe niż dla średniego. Wobec tego podam tylko 
przybliżony wzór dla populacji niezbyt silnie odbiegających od 
formy normalnej: 


5) — Sq/ F—2 
= (W) — $ y on 


Z tego wzoru wynika, że średni błąd dla przeciętnego od- 
chylenia jest nieco większy niż dla średniego. 


Dalej dla momentów trzeciego i czwartego stopnia będziemy 
mieli równania: 


M. (2 16M M. £9MŻ 
sm.) = i SM, POMI 


n 


m) > E 
n 


Zawierają one momenty wyższych stopni, aż do ósmego. 
Oczywiście przy takiej złożoności nie mogą mieć znaczenia prak- 
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tycznego. Ale jeżeli populacja nie odbiega zbytnio od formy nor- 
malnej, następuje znaczne uproszczenie: 


a 2X 
i n 


Bardzo proste są wzory dla HION wskaźnika skośności y, 
i ekscesu yz: 


em) = pe e= y Z =z 


Różnią się one od wszystkich poprzednich tym, że żadne 
momenty w nich nie występują. Dla obliczenia ich wystarczy 
wiedzieć n — liczbę wariantów w próbie. 


Zastosowanie wszystkich tych wzorów z wyjątkiem dwóch 
ostatnich jest utrudnione przez. to, że w nich występują charak- 
terystyki populacji. W praktycznym wykonaniu obliczeń, kiedy 
ma się tylko jedną próbę, niema innego wyjścia jak użycie cha- 
rakterystyki próby zamiast charakterystyki populacji. Dla śre- 
dniego odchylenia ta kwestia była dokładniej omówiona. 


Zastosujmy tytułem przykładu powyższe wzory do liczby 
kwiatów w koszykach sałatnicy. Obliczmy najpierw średni błąd 
= pp arytmetycznej. Otóż mieliśmy dla tego materiału: 

ef. 20, ó = 2.608, n=359. Wypadnie  (m)=0.14 i m= 
= 17.28. = 0.14. 


Obliczmy dalej średni błąd średniego odchylenia. Ponieważ 
eksces y, — — 0.315, otrzymamy e (o) =0.107 i o= 2.603 + 0.107. 


Wreszcie średnie błędy wskaźnika skośności i ekscesu będą 
€ (r) == 0.1 29 > (1) st 0.258 


a zatem y, = — 1.461 + 0.129, y, =— 0.315 + 0.258. 
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Podobnie otrzymamy dla liczby kwiatów w szczytowych 
koszykach bławatka z Zimnej Wody: 


£ 0.34 

+ 0.140 
ROME PA 
+ 0.283 


Na' ostatku trzeba jeszcze rozpatrżyć zagadnienie śred- 
niego błędu dla różnicy między wartościami tej samej charak- 
terystyki obliczonymi dla różnych materiałów statystycznych. 
Jest to zagadnienie bardzo zawiłe. Ograniczę się wobec tego do 
przedstawienia go odnośnie do średniej arytmetycznej. Niech 
kędą dwie próby: jedna złożona z n, wariantów, druga złożona 
z n, wariantów. Te próby mogą pochodzić z tej samej populacji 
albo z różnych. Średnia dla pierwszej z nich niech będzie m', 
dla drugiej m. Sumę kwadratów odchyleń od średniej dla 
pierwszej próby oznaczymy przez 2,, dla drugiej przez 2;. 
Wtedy średni błąd różnicy średnich m—m' wyrazi się 
wzorem 


f Mash 3 


/ 
/ 


e(m —m') = | J 


Jeżeli obie próby są jednakowej wielkości, to znaczy, że 
N, = fo, powyższy wzór ulega uproszczeniu: 
(R WĘGRY 
, ri ę 1 MOGE A) 
Form ray n (n— 1) 
W tym przypadku średni błąd różnicy średnich arytmetycz- 
nych równa się pierwiastkowi kwadratowemu z sumy kwadra- 
tów błędów dla średnich obu prób: 


s(m-m A= ME (m)|*-+is(m P 
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Zastosujmy te wzory. tytułem przykładu do podanych 
w ust. 6 materiałów dotyczącyh liczby kwiatów w szczytowych 
koszykach bławatka pochodzącego z dwóch różnych miejsco- 
wości. Potrzebne -do tego sumy kwadratów odchyleń obliczymy 
według wzoru: | 


on 


n 


Z (u, — u) X u, aE 


w którym a jest wartością wyjściową (por. ust. 13). 


Dia materiału z Zimnej Wody mamy m = 34.77, n, = 300, 
Z (u, — a)? = 10589, Z (u, —a) = 231 przy a=34. 


Dla materiału z Dublan mamy: m'=31.06, n= 200, 
Z (u, — a)? = 5094, Z (u —a) = 130 przy a= 31. 


W wyniku obliczeń otrzymamy: e(m—m ')= +0.51 
i m — m" = 3.71 +0.51. Wypadła różnica między średnimi 
z górą 7 razy większa od swojego błędu. Tak wielką w porów- 
naniu do swojego błędu różnicę można uważać za istotną. Można 
wogóle przyjąć za prawidło, że jeżeli różnica między 
wartościami charakterystyki dla dwóch prób 
przewyższa conajmniej trzykrotnie swój średni 
błąd, to można jąuznać za istotną, czyli nie po- 
chodzącąz przypadku, lecz spowodowaną przez 
różnicę w charakterze materiałów, z których 
próby były wzięte. Jeżeli natomiast ta różnica jest 
mniejsza od trzykrotnego błędu, trzeba już liczyć się z możli- 
wością przypadkowego zestawienia prób z tej samej populacji. 
Tak właśnie będzie, jeżeli porównamy ze sobą nie całości ma- 
teriałów z Zimnej Wody i Dublan, lecz tylko koszyki „ósem- 
kowe” — z ośmioma obwodowymi płonnymi kwiatami 
(tab. 30,1). 


* Tabela 30,1 


Liczby kwiatów w szczytowych koszykach bławatka 
z 8 płonnymi obwodowymi kwiatami. 


ż Ich częstości w materiale E Ich częstości w materiale 
Liczby Liczby 


kwiatów | z Zimnej Sabian kwiatów | z Zimnej 
Wody z 


t 
z Dublan 
| 


| 


| 


| 


1 
net 
1 
Ama 1 
2 1 
1 1 
się: 4 
13 10 
10 9 
9 2 
12 5 


Mamy teraz dla materiału z Zimnej Wody m'= 30.88, n; = 91, 
2 (u, —a) = 1116, 2 (u; —a)=80 przy a=30. Dla materiału 
żaś  Dublańskiego: m —=31.37, na=59, 2 (u; — a)? =982, 
2 (ui-—a) =22 przy a=31. Z tych danych otrzymamy dla róż- 
nicy średnich arytmetycznych średni błąd e (m — m") = 4 0.62, 
a zatem m —m' =—0.49 + 0.62. Różnica średnich wypadła 
tu mniejsza od swojego błędu. By ocenić jej wartość, trzeba 
obliczyć prawdopodobieństwo pochodzenia jej z przypadku. 
To zagadnienie będzie omówione w następnym rozdziale. 


31. Wiarogodność charakterystyk małych prób. Z wywodów 
poprzedniego ustępu wynika, że błąd średni tylko przy wiel- 
kich próbach rozwiązuje zagadnienie wiarogodności charakte- 


|. 
| 
| 
| 
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rystyk. Dla prób małych, z jakimi na przykład wypada praco- 
wać w doświadczalnictwie rolniczym, trzeba szukać innej drogi. 
Nie można tu zastępować wartości charakterystyk populacji 
przez ich wartości dla próby. Trzeba częstości 
względne, inaczej mówiąc prawdopodobień- 
stwa statystyczne różnic między charaktery- 
stykami próby i populacji wyznaczać bezpo- 
średnio według właściwości próby. Rozwiązanie 
postawionego w ten sposób zagadnienia wypadnie naturalnie 
różnie. zależnie od charakteru populacji. W dotychczasowych 
pracach nad tym zagadnieniem przyjmowało się, że populacja 
ma charakter normalny. Na szczęście okazało się, że dla innego 
rodzaju populacji wyniki zachowują swoje znaczenie, o ile 
rozkład częstości różnych wartości wariantów w populacji nie 
zanadto odbiega od rozkładu normalnego. 

Dla średniej arytmetycznej zagadnienie zostało rozwią- 
zane przez Williama Gosseta (1876 — 1937) piszącego 
pod pseudonimem Student. Stopień zgodności między śre- 
dnią próby a średnią populacji określił on za pomocą funkcji 
= s5 n A gdzie m jest Średnią dla próby, M — średnią dla 
populacji, e (m) — średnim błędem średniej arytmetycznej 
próby. Wartości funkcji t mogą być dodatnie i ujemne sto- 
sownie do znaku. różnicy m — M. Absolutna wartość ich jest 
na ogół tym mniejsza, im średnia próby jest bliższa Średniej 
dla populacji, ale nie zawsze. 

Na przykład jeżeli weźmiemy znowu populację 1, 2, 3, 4, 5, 
to na podstawie tabeli 28,2 otrzymamy dla 35 rodzajów prób 
następujące wartości t (tab. 33,1). W tej tabeli nieokreśloną 
wartość 4 dla prób 333 przyjmiemy równą zeru. Z niej wi- 
dzimy na przykład, że próby 334 dają Średnią różniącą się od 
średniej populacji o 73, próby zaś 155 średnią różniącą się 
o %3 a jednocześnie t dla pierwszego rodzaju prób jest równe 
1.0, podczas gdy dla drugiego rodzaju ma wartość 0.5 — nie 
większą zątem, jak by się należało spodziewać, lecz mniejszą. 


/ Tabela 31,1 


Wartości Wartości 
Rodzaje RARE 
a tye 
00 prób w 1/3 
135 | 0 —5.0000 
144 | | ETAF AE mirri 
225 | 28 $ W TO 
234 —0.2773 
333 : —0.3780 
ER A —0.5000 
0.2773 3: —1.0000 
0.8780 ofzni LLL ; 
0.5000 h —0.5000 
1.0000 | —0.7560 
ATS SE —1.0000 
0.5000 —2.0000 
0.7580: Fa De dsc 1 ELU 4 
1.0000 
2.0000 


4 2.0000 |— 
| | 4.0000 111 


Wobec powyższego w dalszym ciągu tych wywodów bę- 
dziemy nazywać „lepszymi” próby mające t o wartościach ab- 
solutnych mniejszych, jakkolwiek ich średnie nie zawsze będą 
bliższe średniej dla populacji niż średnie prób „gorszych”. 


W tym założeniu Student dowiódł, że częstość względna 
występowania wartości funkcji t w zespole prób wziętych. 
z populacji o formie normalnej wyraża się funkcją: 


T X z 


n TEER 
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w której współczynnik C zależy tylko od wielkości próby. 
Można go obliczyć za pomocą funkcji „gamma”, oznaczanej 
symbolem F (x): 
R 
(72) 


/sn-1r(>"') 


Funkcja gamma określa się równaniem 


C 


r c --1 = lim : 1.2.8, 64m 1)n = 
| n=e C(+1)(1+2). . (© 4-n) 


Funkcja s (t) daje jednakowe wartości dla dodatnich i ujem- 
nych wartości zmiennej niezależnej, podobnie jak funkcja 
de Moivre'a. Tak samo jak ta ostania, funkcja s(t) maleje 
nieograniczenie ze zwiększeniem absolutnej wartości t. Ze 
zwiększeniem wielkości próby zbliża się ona do funkcji de 
Moivre'a i dla n=ooprzybiera znaną już nam formę: 


Za pomocą rachunku całkowego można obliczyć dla każdej 
wartości t częstość względną prób o wartościach tej zmiennej 
mniejszych od danej; przy czym naturalnie wszystkie wartości 
ujemne trzeba uważać za mniejsze od najmniejszych nawet 
dodatnich. Uskutecznia się to za pomocą całki 

t p £ 
so=cf i+- 2 dt 
— %0 
analogicznej całki Laplacea. Tak samo jak ta ostatnia, 
całka S(t) określa pole figury, zakreślonej przez oś odciętych 
1 krzywą funkcji s(t), licząc od lewego jej końca do rzędnej 
odpowiadającej danej wartości t (por. ryc. 5). 

Tak samo jak dla całki Laplace'a, pole całej tej figury 
równa się jedności, a rzędna t=0 dzieli to pole na dwie równe 
części. W ten sposób S(—»)=0, S(0) =0,5, S(+~x)=1. 
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Wartość całki S(t) dla t = 0 są podane w końcu książki 
w tabeli E. Przy korzystaniu z tej tabeli przeważnie jest obo- 
jętne czy średnia próby jest większa, czy mniejsza od średniej 
dla populacji, chodzi tylko o to, jak bliska jest tej ostatniej. 
Stąd wypada opierać się na absolutnej wartości t bez uwzględ- 
nienia znaku i poszukiwać częstość względną prób, dla któ- 
rych wartość bezwzględna t jest mniejsza od wartości bez- 
względnej tej funkcji dla danej próby. Dlatego też w tabeli Æ 
są pominięte wartości funkcji S(t) dla wartości t < 0. 


Niech będzie a absolutną wartością funkcji t dla danej pró- 
by. Wtedy częstość względna prób, mających t o wartości ab- 
solutnej mniejszej od o, czyli pole prób „lepszych od danej, 
będzie równa polu wycinka figury krzywej, ograniczonej przez 


Ryc. 8. 


rzędne t=—a i t= +a (ryc. 8). Ta częstość wyraża się 
wzorem: P||t| <a | = 2 S(a) — 1, w którym literą P jest ozna- . 
czone prawdopodobieństwo zależności przedstawionych przez 
symbole zawarte w nawiasach | |. Będzie to prawdopodobień- 
stwo statystyczne prób lepszych od danej. 


Na podstawie powyższego wzoru można wyznaczyć ta- 
kie a, żeby próby mające t zawarte w granicach od —a do 
+ a stanowiły z góry określoną część ogółu prób. Wielkość tej 
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części może być obrana dowolnie i nosi nazwę współczyn- 
nika ufności. Jeżeli oznaczymy ten współczynnik przez £ 
(8< 1), to będziemy mieli równanie f=2S(a)—1. Z niego 


włyprowadzamy zależność S(a) = — kt która da możność 


wyznaczania a według tabeli dla funkcji S (t). 


= M] 
Dalej mamy |t|=——,-u-. Wobec tego. będziemy mieli 


s (m) 
„deki Stąd ł ó i 
Bri) =a. Stąd wypływa równanie 


P(|m—M|<ae(m)) =f, 


z którego wynika, że nieznana średnia populacji mieści się 
w granicach między m— a e(m) i m ta e(m) z prawdopodo- 
dobieństwem równym współczynnikowi ufności, W praktyce 
współczynnik ufności przyjmuje się zwykle równy 0.95 albo 0.99. 
Dla tej drugiej wartości wypada a większe i przeto granice za- 
kreślone dla średniej populacji szersze. Wybór takiego czy 
innego współczynnika ufności zależy od ważności zadania oraz 
od psychologii badacza. Dla ważniejszych zagadnień bierze się 
współczynnik większy. Ostrożniejsi badacze wolą większe współ- 
czynniki dla większej pewności — ostrożność nigdy nie za- 
wadzi! 

Zastosujmy tę metodę do konkretnego przykładu. Otóż 
w pewnym doświadczeniu wykonanym na torfowisku Czemerne 
pod Sarnami w r. 1931') sucha masa trawy na 4 poletkach 
z pełnym nawożeniem o powierzchni 50 m* wyniosła w kilo- 
gramach 55.1, 50.3, 58.4, 45.6. Wypada z tych danych średnia 
arymetyczna 52.35, jej Średni błąd 2.78. Wynikało by z tego, 
że gdyby doświadczenie było wykonane nie na czterech polet- 
kach, ale na bardzo wielkiej ich liczbie i gdybyśmy wzięli 
z takiej populacji nie jedno doświadczenie, 4-poletkowe, lecz 
wielką ich ilość, to dwie trzecie tych doświadczeń dałoby śred- 

y D. Szymkiewicz i B. Świętochowski. Doświadcze- 
nia nad żyznością torfów. — Rocznik łąkowy i torfowy. 1936. 


nie plony zawarte w granicach od 52,35—2.78 do 52.35.+ 2.78. 
Tak wypadło by, gdyby Średni błąd był dokładnie obliczony. 
Otóż było już wyjaśnione w ust. 30, że to tak nie jest, jeżeli 
próba jest mała. Za pomocą funkcji S(t) możemy dokładniej 
obliczyć wspomniane granice. 


SEEN OPER 


W tym celu trzeba przyjąć dla współczynnika ufności war- 
a V 

> t — dla S(a) wartość 

0.833. Z tabeli funkcji S(t) przez interpolację wyprowadzamy 

wartość dla a równą 1.15 i wobec tego granice, w których 

mieszczą się średnie dwóch trzecich prób będą szersze w sto- 

sunku 1.15:1, a więc wyniosą 52.35 — 3.20 i 52.35 + 3.20. 


Ale współczynnik ufności 3 jest za mały. W praktyce bierze 
się conajmniej 0.95. Wtedy wypada S(a) = 0.975, a= 3.2 i gra- 
nice, w których mieszczą się średnie 95% prób, będą 52.35 — 8.90 
i 52.35 + 8.90. W tych też granicach z prawdopodobieństwem 
0.95 będzie się mieściła średnia całej populacji złożonej z wy- 
ników doświadczeń na nieograniczonej liczbie poletek. Prawdo- 
podobieństwo 0.95 oznacza, że 5% prób 4-poletkowych dałoby 
inny wynik — inne granice dla średniej arytmetycznej popu- 
lacji. Nigdy nie jest wykluczone, że się na taką próbę natrafi 
— jak się ma pecha, to nic na to się nie poradzi. 
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Dla ułatwienia omawianych obliczeń podaję za R om a- 
nowskim tabelę 31,2 wartości a dla dwu najczęściej uży- 
wanych współczynników ufności 0.95 i 0.99 przy różnym zakresie 
prób, począwszy od prób czwórkowych. Dla prób o zakresie 
większym od 20 można używać wartości dla prób nieskończonej 
wielkości. 

Funkcja s(t) i wywodząca się z niej S(t) znajdują jeszcze 
dalsze i to ważniejsze zastosowanie. Mianowicie pozwalają 
one stwierdzić z określonym prawdopodo- 
bieństwem, czy różnica między średnimi aryt- 
metycznymi dwóch prób pochodzi z przypad- 
ku, czy też stąd,że próby były wybrane z róż- 
nych populacji. 
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Będziemy rozumowali w sposób następujący. Wybieramy 
z populacji wszelkie możliwe próby po n, wariantów, następnie 
wszelkie możliwe próby po n, wariantów. Każdą próbę pierw- 
szej grupy zestawiamy kolejno ze wszystkim próbami drugiej. 
Dla każdej pary prób obliczamy wartość funkcji 

j— m'— m” 
e(m' — m”) S 

gdzie m’ jest średnią arytmetyczną jednej próby, m” taka sama 
charakterystyka drugiej próby a (m — m”) — średni błąd 
różnicy średnich, obliczony według wzoru podanego w ust. 30. 


Tabela 31,2 
Wartości a dla różnych wielkości prób (n) 


Współczynnik ufności 
0.95 | 0.99 
5.85 3.01 
4.60 | 2.98 
4.04 5 „le | 2.95 
3.70 2, | 2.92 
3.50 2. | 2.90 
3.86 ( 2. | 2.89 
3.25 i | 2.87 
3.17 2.09 | 2.86 
3.11 2.58 
3.06 
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Widoczne jest od razu, że funkcja t jest podobna do roz- 
patrzonej poprzednio funkcji 


Może nawet być z tej ostatniej wyprowadzona. Istotnie jeżeli 
weźmiemy populację złożoną z różnie m’ — m”, to średnia aryt- 
metyczna takiej populacji będzie równa zeru, gdyż dla każdej 
różnicy m — m” można dobrać różnicę m”—m' równą, ale 
ze znakiem odwrotnym. Można więc założyć we wzorze funkcji t 
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M=0. Wystarczy teraz zamiast średnich m wprowadzić 
różnice średnich m — m”, by z równania funkcji t otrzymać. 
równanie dla funkcji t’. ; 4 

Wartość absolutna Ít] śą na oby tym mniejsza, im mniej-. 
sza jest wartość absolutna |m — m” |. Zależy ona jednak tak- 
że od wielkości błędu e (m — m”). Jeżeli przeto będziemy po- 
równywali różne pary prób, może się zdarzyć, że jedna para 
prób będzie miała większe jt'| a mniejsze jm —m”| niż druga 
para. Pod tym względem występują: tu podobne zdarzenia jak 
dla funkcji t, gdzie dla większych |t | trafiają się mniejsze róż- 
nice [m — M|. Można powiedzieć, że dwie próby są tym bar- 
dziej „zgodne”, im mniejsze jest dla nich |t|, a to w tym da- 
nym sensie, w jakim nazywaliśmy „lepszymi” próby o mniej- 
szym |t]. 

Przy powyższych założeniach można dowieść, że częstości 
względne wartości t` wyrażają się tą samą funkcją Studenta, 
z jaką mieliśmy do czynienia poprzednio. Będziemy tedy mieli 
funkcję: 


UW 3 
stj=Cc (1 i wN 2 


w której n =n, + n, — 1. Będziemy także mieli funkcję: 
al y 
st)=c | (1- 
> © o) 
która będzie dawała częstości względne dla wartości ť mniej- 
szych od danej. 

Jeżeli teraz mamy jakąś parę prób o wartości t', której 
absolutna wielkość równa się a, to częstość względna par prób 
bardziej od niej „zgodnych” wyrazi się równaniem Pj |t| < a} = 
= 25(a) — 1, takim samym jakie mieliśmy dla częstości prób 
„lepszych” niż ta próba, dla której [t] = a. 

Po tych wstępnych wywodach powróćmy do naszego za- 
gadnienia. Mamy parę prób. Jeżeli one pochodzą z tej samej 
populacji, to nie powinno być zbyt dużo par prób zgodniejszych 
od nich, bo takie próby odznaczają się większą zgodnością niż 
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próby wzięte z różnych populacyj. Można wobec tego wybrać 
pewną granicę, której częstość prób zgodniejszych niż dane nie 
powinna przekraczać. Można ją nazwać tak samo współczynni- 
kiem ufności, jak poprzednio przy rozpatrywaniu odchyleń 
średnich dla prób od średniej dla populacji. Jeżeli ta granica 
nie jest przekroczona, można będzie uznać, że próby pochodzą 
z tej samej populacji. Jeżeli zaś częstość prób zgodniejszych 
niż dane wypadnie większa od współczynnika ufności, to trzeba 
będzie uznać, że próby pochodzą z różnych populacji. Trzeba 
zatem dla danej pary prób obliczyć wartość ť i według tabeli 
funkcji S(t) obliczyć prawdopodobieństwo bardziej zgodnych 
prób według przytoczonego poprzednio równania Pilaa 
= 2S (a) — 1. Badanie sprowadza się ostatecznie do sprawdzenia 
czy prawdopodobieństwo statystyczne P | |t'j <a! jest mniejsze. 
czy większe od współczynnika ufności, który wybiera się zwykle 
w wymiarze 0.95 albo 0.99, tak samo jak poprzednio. 

Zastosujmy powyższe prawidło do konkretnych przykła- 
dów. I tak we wspomnianych powyżej kulturacit na torfowisku 
Czemernem oprócz pełnego potasowo-azotowo-fosforowego na- 
wożenia [KNP| stosowano także nawożenie potasowo-azotowe 
bez fosforu |KN| i azotowo-fosforowe bez potasu [NP]. Wszyst- 
kie doświadczenia były 4-poletkowe. Nawożenie |KN| dało 
plony siana 47.8, 47.6, 46.0, 47.2 kg, nawożenie |NP| 29.9, 
19.0, 22.2, 24.7. Pierwsze dało Średnią 47.15, + 0.40, drugie 
23.95 + 2.30. Zestawiając te dane z plonami otrzymanymi na 
pełnym nawożeniu, otrzymamy różnice: 

|KNP|—|KN]= 5. Aa +281 
[KNP] — [NP] = 28.40 + 3.61 

Stąd dla pary prób [KNP] — [KN] otrzymamy ť = 1.85, dla 
pary zaś |KNP|— [NP] ť = 7.87. Ponieważ zakres prób obej- 
mował 4 warianty, mamy n = 7. Stąd według tabeli funkcji S(t) 
znajdziemy dla rozpatrywanych par prób prawdopodobieństwa 
statystyczne 


P { |t |< 1.85) = 0.886 
P(1t1<7.87) = 1.000 
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Wnosimy stąd, że próby pierwszej pary można uważać za 
pochodzące z tej. samej populacji, próby zaś drugiej za pocho- 
dzące z różnych populacyj. W ten sposób różnica w plonach 
wynikająca z niezastosowania nawozów fosforowych okazała 
się przypadkową, natomiast różnica powodowana przez brak 
potasu była istotna. 


Omawiana metoda porównywania średnich dla prób może 
być stosowana także do dużych prób. Zastosujmy ją do liczb 
kwiatów w koszykach bławatka z Zimnej Wody i Dublan (tab. 
5 (1) oraz 5,1 i 30,1). Tu według obliczeń ust. 30 dla całości obu 
materiałów wypada m —m”=3.71--0.51. Stąd [t|=17.27. 
Wypada P prawie równe jedności. Te materiały możemy uznać 
za pochodzące z różnych populacyj nawet przy największym 
współczynniku ufności. Natomiast dla koszyków z ośmioma 
płonnymi kwiatami obwodówymi otrzymaliśmy m — m” = 
=— 0.49 + 0.62 a zatem [t| =0.79 i P=0.785. Można więć 
przyjąć, zarówno przy współczynniku ufności 0.95, jaki 0.99, że 
„ósemkowe” kószyki pochodzą z tej samej populacji. 
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Podobna do powyższej metoda oceny wiarogodności śred- 
niej arytmetycznej żostała przez Studenta i Fishera 
zastosowana do średniego odchylenia. Rolę funkcji t od- 
grywa tu inna funkcja. Nie będziemy rozpatrywali tego za- 
gadnienia, gdyż znaczenie jego jest niewielkie. Odnośne infor- 
macje znajdzie czytelnik w podręcznikach Fishera i Ro- 
manowskiego. 


32. Krańcowe warianty. Trzeba omówić jeszcze ostatnią 
kwestię dotyczącą wiarogodności charakterystyk. Wartości nie- 
których z nich załeżą w silnym stopniu od krańcowych warian- 
tów, mianowicie wartości momentów wyższych rzędów. Pocho- 
dzi to stąd, że częstości krańcowych wariantów przy obliczaniu 
takich momentów są mnożone przez wysokie potęgi odchyleń. 
Stąd już zmiana tych częstości o jedynkę wystarcza, by w wy- 
niku wystąpiła poważna różnica, a takie zmiany skutkiem przy- 
padkowości w doborze wariantów są na porządku dziennym. 
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Szczególnie duże różnice w wartościach momentów występują ` 
wtedy, kiedy materiał jest nieliczny. Jako przykład tego ro- 
dzaju zjawisk można przytoczyć odosobniony pojedyńczy wa- 
riant o wartości 62 w materiale bławatka. Jeżeli go odrzucimy, 
to przy trzecim sposobie grupowania otrzymamy: m = 11.547 
zamiast 11.576, m, = 3.630 zamiast 3.958, m; = + 3.519 zamiast 
+ 5.424 i m,= 45.42 zamiast 64.35. 

Dla zaradzenia złu, powodowanemu przez niepewności 
w liczbie krańcowych wariantów, trzeba je odrzucać, ale na- 
leży postępować ostrożnie, kierując się pewnym prawidłem. 
Chodzi tu o pojedyńcze warianty wysokiej względnie niskiej 
wartości, takie jak przytoczony powyżej wariant 62 w ma- 
teriale bławatka. Prawdopodobieństwo występowania takich 
wariantów jest małe. Przeto wystąpią one tylko w części prób 
wybranych z danej populacji. Jeżeli jednak skutkiem przypad- 
kowego zbiegu okoliczności wystąpią w rozpatrywanej próbie, 
można je odrzucić, jeżeli ich średnia częstość w próbach danej 
wielkości jest mniejsza niż %, gdyż wtedy w większości prób 
one nie ukażą się wcale. Jest to prawidło zaproponowane przez 
Chauveneta. Trzeba je stosować osobno dla krańcowych 
plus wariantów i minus wariantów. 

Dla zastosowania prawidła Chauveneta trzeba znać 
ogólny rozkład częstości w rozpatrywanym materiale. Dokładna 
znajomość tego rożkładu jest oczywiście niemożliwością. Ale 
wystarczy znajomość ogólnikowa. W szczególności łatwo jest 
stosować prawidło Chauvenet'a do szeregów rozdzielczych 
o formie zbliżonej do normalnej. Wtedy za pomocą całki 
Laplace'a można obliczyć prawdopodobieństwo występowa- 
nia skrajnych wariantów, a mnożąc to prawdopodobieństwo 
przez liczbę wariantów w rozpatrywanej próbie, można zna- 
leźć średnią częstość takich wariantów w próbach danej wiel- 
kości. Oznaczając przez p wspomniane prawdopodobieństwo, 
przez n liczbę wariantów w próbie, otrzymujemy równanie 


1 
np='/ą, z którego wypływa p= g Według tej wartości p 


z tabeli całki Laplace'a znajdujemy wartość zmiennej ć. 
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której dane p odpowiada. Jak to już nam jest wiadomo z ust. 25, 
zmienna ć jest związana ze zmienną ewentualną równaniem 


PET „z której wypływa x=9< m. Jeżeli obliczona 


w ten sposób.wartość x wynosi a, to trzeba odrzucić minus 
warianty o wartości <a i plus warianty o wartości większej 
niż a + m. 

Dla przeprowadzenia takich obliczeń potrzebne są wartości 
całki Laplace'a dla wysokich wartości zmiennej $ z 5 zna- 
kami dziesiętnymi. Tabela B do *tego nie zawsze wystarcza 
i dlatego podaję dodatkową tabelę 32,1. 

Zastosujmy powyższe wywody do materiału bławatka 
zgrupowanego trzecim sposobem. Ponieważ liczba wariantów 
jest tu 300, wypada p = '/60= 0.00167. Z tabeli 32,1 wynika, 
że 6=2.93, a ponieważ m = 11.576 i o = 1.968, otrzymujemy 

= 5.766. Trzeba zatem odrzucić minus warianty o wartości x' 
mniejszej niż 5.766 i plus warianty o wartości x' większej niż 
17.342. Wypadnie więc zachować wszystkie minus warianty 
i odrzucić krańcowy plus wariant 62 z klasy « = 20 %, o któ- 
rym była mowa poprzednio. 


Tabela 32,1 


Wartość całki Laplace'a w stutysięcznych 


Tabela 32,2 


Częstości (w tysięcznych) temperatur minimalnych powietrza 
w trzech dekadach maja 


: Kraków Tarnopol 
Temperatury |—7 ki FE SETKI 
2 [ya WAS |--3 


Í 
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(-4.9)-(-0.1)| 20 | 10 | 10| — | 66 | 43 
00—49 | 175 | „41 | 265 | 115 | 68 | 359 | 325 
50—9.9 | 670 | 605 | 350 | 425 | 425 | 336 | 407 | 380 | 378 
10.0 — 14.9 | 135 | 255 | 554 | 285 | 390 | 564 | 156 | 252 | 449 
150-190) — | 5) 50] 15°] 33] DZT 
Średnie 7 | 86 |10.7 | 7.4 | 9.2 |103 | 59 | 6.6 | 9.7 


temperatur 


Na tym jeszcze nie koniec. Bywają przypadki, w których 
nie ma mowy o odrzucaniu skrajnych wariantów, kiedy prze- 
ciwnie — mają te warianty największe znaczenie. Tak jest 
na przykład z minimalnymi temperaturami powietrza w wio- 
sennych miesiącach, kiedy częstości krańcowych najniższych 
temperatur schodzących poniżej zera określają częstość zgub- 
nych dla roślinności wiosennych przymrozków. Ilustracją może 
być tabela 32,2 obliczona dla Krakowa, Tarnopola i Wilna na 
podstawie 20-letnich obserwacyj. 


ROZDZIAŁ VI. 


WYRÓWNANIE SZEREGÓW ROZDZIELCZYCH. 


33. Ogólne zasady. Widzieliśmy na przykładzie bławatka 
w ust. 5 , że ciągi częstości w szeregach rozdzielczych wyka- 
zują zazwyczaj przeskoki, powodowane przez przypadkowość 
prób. Dla wyrównania tych przeskoków łączy się wartości 
zmiennej ewentualnej w klasy, których szerokość wybiera się 
o tyle dużą, ażeby częstość zmieniała się stopniowo. Pociąga to 
tę niedogodność, że zatracają się częstości dla poszczególnych 
wartości zmiennej ewentualnej. Tymczasem są one nieraz po- 
 trzebne dla różnych celów, zwłaszcza praktycznych, np. 
w ubezpieczeniach. Są m. inn. potrzebne dla wyznaczenia war- 
tości modalnej. Dla zaradzenia złemu trzeba przedstawić sze- 
regi w formie funkcyj, które dadzą możność obliczenia czę- 
stości dla każdej wartości zmiennej ewentualnej, np. w przy- 
padku bławatka częstości poszczególnych liczb kwiatów w ko- 
szykach. . ; 

Poza tym tego rodzaju funkcje charakteryzują zmienność 
materiałów statystycznych i mogą zastąpić omówione w roz- 
działach Il i III charakterystyki. 

Jakie funkcje mogą być użyte do zobrazowania szeregów 
rozdzielczych? Pierwszy warunek po temu jest, żeby nie przy- 
bierały wartości ujemnych, bo częstości są zawsze dodatnie. 
Poza tym w zasadzie każda funkcja może być użyta. Trzeba 
jeszcze dobrać taką, któraby dostatecznie dokładnie przedsta- 
wiała szereg rozdzielczy. Nie chodzi przy tym bynajmniej o to, 
„by dokładność była zupełna, co jest łatwo osiągnąć za pomocą 
funkcji Lagrange'a. Trzeba bowiem mieć na uwadze, że 
ma się zwykle do czynienia z przypadkowymi próbami i przeto 
stojące do dyspozycji wartości częstości nie są dokładne. Na- 
leży zatem wybrać takie funkcje, któreby wyrównywały przy- 
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padkowe odchylenia częstości w próbie do odnośnych częstości 
w populacji. Stąd wynika, że przy wyborze funkcyj trzeba kie- 
rować się nauką o prawdopodobieństwie. 

Najgłębsze badania nad omawianym zagadnieniem prze- 
prowadził Charlier*), opierając się na zasadach wyłożo- 
nych w wiekopomnym dziele Laplace'a „Thóorie analitique 
des probabilités”. W tych badaniach traktował Charlier 
specjalnie kwestię błędów obserwacyjnych, ale jego sposób ro- 
zumowania może być zastosowany także do innych podobnych 
faktów. Można mianowicie rozumować w sposób następujący. 
Mamy taką czy inną zmienną — mogą to być wyniki pomiarów, 
liczby kwiatów itp. Wartości tej zmiennej zależą z jednej 
strony od przyczyn działających stale, z drugiej zaś strony od 
przyczyn występujących od czasu do czasu. Mamy tu te same 
dwa rodzaje przyczyn, z którymi zaznajomiliśmy się w nauce 
o prawdopodobieństwie i które były nazwane określonymi 
i nieokreślonymi. Te ostatnie mogą być także nazwane przy- 
padkowymi. Gdyby przyczyn przypadkowych nie było, 
zmienna miałaby stałą niezmienną wartość. Działania tych 
przyczyn powodują odchylenia od wspomnianej stałej war- 
tości. Nie znając bliżej przyczyn przypadkowych, można wiel- 
kość i częstość odchyleń przedstawić za pomocą pewnych funk- 
cyj, jężeli się założy, że przyczyny przypadkowe są liczne i że 
działanie każdej z nich z osobna jest słabe. Przy takich zało- 
żeniach Charlier dowiódł, że zmienność powodowana przez 
przyczyny przypadkowe da się zobrazować za pomocą dwóch 
rodzajów funkcyj, nazwanych przez niego „typem A” i „ty- 
pem B”. 

Pierwszy z tych typów wyprowadza się z funkcji 
de Moivre'a i charakteryzuje szeregi dwuboczne niezbyt 
odbiegające od formy normalnej. Sama funkcja de Moivre'a 
stanowi poszczególny przypadek tego typu. Typ B wyprowa- 
dza się z szeregu Poissona i stosuje się do szeregów jedno- 


mt. „Ueber das Fehlergesetz* (Meddelanden fran Lunds Astrono- 
miska Observatorium N. 25) oraz „Die zweite Form des Fehlerge- 
setzes* (ta sama seria praw N. 26). 
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bocznych oraz do dwubocznych silnie odbiegających od formy 
normalnej. Naturalnie sam szereg Poissona należy do tego 
typu. Typ B stopniowo przechodzi w typ A przy zwiększeniu 
charakterystycznej dla niego stałej +. 

Wszystkie te funkcje wywodzą się, jak to było wyjaśnione 

w ust. 25.i 26, z szeregu dwumianowego. W pewnych przy- 
padkach sam ten szereg może służyć do wyrównywania sze- 
regów rozdzielczych. 
i- /W praktycznym zastosowaniu po wyborze rodzaju funkcji 
trzeba wybrać określoną jej formę. Do tego służy oczywiste 
prawidło, że średnia arytmetyczna oraz momenty funkcji 
służącej do wyrównywania szeregu rozdziel- 
czego powinny być równe odnośnym charak- 
terystykom szeregu. 

Dodatkowo należy zaznaczyć, że liczni statystycy propono- 
wali wiele różnych funkcji do wyrównywania szeregów roz- 
dzielczych. Najdokładniej tę kwestię rozważał Pearson. Za- 
proponował on użycie oprócz szeregu dwumianowego i funkcji 
de Moivrea jeszcze siedmiu innych funkcji. Obszerny wy- 
kład tych funkcyj -znajdzie czytelnik w książce W. Palin 
Eldertona „Frequency curves and correlation” (3 wyd. 
Cambridge 1838). 


34. Szereg dwumianowy. Rozpoczniemy od szeregu dwumia- 
nowego, z którego wywodzą się, jak widzieliśmy, inne funkcje 
charakteryzujące zmienność szeregów rozdzielczych. Pomimo 
swojego podstawowego: charakteru może on być stosowany tyl- 
ko w bardzo ograniczonym zakresie. Przyczyną tego jest mała 
rozmaitość jego form. Jak to było wyjaśnione w ust. 24, formy 
te są określone przez dwie tylko wielkości n i p. Tymczasem 
dla charakterystyki materiałów statystycznych trzeba użyć co 
najmniej czterech: a mianowicie średniej arytmetycznej oraz 
momentów drugiego, trzeciego i czwartego stopnia. Średnie 
arytmetyczne można wyrównać przez odpowiednią zamianę 
zmiennej ewentualnej, mamy więc do obliczenia dwóch charak- 
terystycznych stałych szeregu dwumianowego trzy równania. 
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Oczywiścię wielkości otrzymane z dwóch równań nie muszą 
czynić zadość trzeciemu. Jeżeli naprzykład szereg dwumianowy 
będzie miał właściwe momenty drugiego i trzeciego stopnia, 
to na ogół wykaże inną wartość dla momentu czwartego stop- 
nia niż rozpatrywany szereg rozdzielczy. 

Właściwe swoje zastosowanie znajduje szereg dwumianowy 
w zagadnieniach dotyczących powtarzania się zdarzeń, z których 
to zagadnień został wyprowadzony. Rozpatrzymy w tym wzglę- 
dzie dwa przykłady zaczerpnięte z książki Fishera. 

Pierwszy przykład dotyczy gry w kości. Rzucano naraz 
12 kości i notowano, na ilu kościach ukazywały się liczby 5 i 6. 
Rzutów dokonano 26 306. Segregując te rzuty według liczby 
kości z numerami 5 albo 6, otrzymano interesujący szereg roz- 
dzielczy przedstawiony w tabeli 34,1 wraz z różnymi liczbami, 
odnoszącymi się do danego zagadnienia. 


Tabela 34,1 
Rzuty dwunastoma kośćmi 


Rzuty Liczby takich rzutów Liczby 


o różnych blie rzutów 
ilościach obliczone obliczone 
GuGól zńu: obserwo- dla kości | Różnice ak wykray- 


merami 5 wane prawidło- 
albo 6 wych 


185 203 —18 SEE 2 


Różnice 
względem 
liczb 
obserwo- 
wanych 


1149 1216 —67 —3 
3265 3345 — 80 m 50 
5475 5576 —101 1 10 
6114 , —159 5 155 
5194 | i 76 
3067 +24 
1331 Fi 

— -21 
r9 
-= 1 


= 


6306 s 


W trzeciej kolumnie tej tabeli są podane liczby rzutów 
obliczone teoretycznie za pomocą szeregu dwumianowego. Cho- 
dzi tu mianowicie o powtarzanie się pewnego zdarzenia — wy- 
stąpienia numeru 5 albo 6 — w dwunastkowych zbiorach przy- 
padków. Prawdopodobieństwo takiego zdarzenia jest równe 


z=4. Wyniki doświadczenia powinny zatem układać się we- 


/ 12 
dług szeregu dwumianowego ( A + = . Widzimy, że zgodność 


teorii z faktami jest dosyć dobra. Rzuca się jednak w oczy, że 
odchylenia liczb teoretycznych od obserwowanych są z początku 
stale dodatnie, potem zaś stale ujemne. Jeżeli te odchylenia 
mają być rzeczą przypadku, to ujemne ich wartości powinny 
być rozrzucone wśród dodatnich. To nasuwa przypuszczenie, 
że prawdopodobieństwo rozpatrywanego zdarzenia nie było 
dokładnie 43. Przyczyną mogło być wykrzywienie kości, co przy 
tak wielkiej liczbie rzutów nie byłoby niespodzianką. Istotnie 
obrachowując liczbę wszystkich przypadków wystąpienia nu- 
meru 5 albo 6 otrzymujemy wartość 106 602 na ogólną liczbę 
przypadków wynoszącą 315672. Daje to prawdopodobieństwo 
nieco większe od 73 a mianowicie 0.3376986. Obliczając ilości 
rzutów przy takim prawdopodobieństwie, otrzymujemy liczby 
kolumny piątej. Odchylają się one od liczb obserwowanych 
w mniejszym stopniu niż ilości rzutów obliczone dla prawidło- 
wych kości, zestawione w kolumnie trzeciej. Co więcej, ujemne 
odchylenia są teraz pomieszane z dodatnimi. Można przypuścić, 
że pochodzą one z przypadku. 

Rozpatrzone doświadczenie Fishera ma niemałe zna- 
czenie dla zagadnienia prawa wielkich liczb (ust. 21). Widzimy 
tu dosyć znaczne odchylenie obserwowanych częstości od praw- 
dopodobieństwa pomimo ogromnej liczby przypadków — z górą 
300 tysięcy! Spotkaliśmy się nadto z trudnością, z jaką jest 
związane otrzymanie licznych materiałów statystycznych, 
z trudnością polegającą na ścisłym zachowaniu tych samych | 
warunków: w ciągu całego doświadczenia. 


W doświadczeniu Fishera rozpatrywaliśmy po raz 
pierwszy stopień zgodności między szeregiem rozdzielczym 
a funkcją użytą do wyrównania. Ściślej mówiąc są tu dwa 
odrębne zagadnienia: jedno dotyczy stopnia zgodności między 
teorią a doświadczeniem, drugie zaś kwestii, czy odchylenia 
liczb doświadczenia od liczb teoretycznych pochodzą z przy- 
padku, czy też z nieodpowiedniego doboru funkcji. 

Pierwsze zagadnienie najprościej może być rozwiązane 
przez obliczenie stosunku sumy absolutnych wartości odchyleń 
od sumy wartości funkcji względnie liczebności szeregu. Ten 
stosunek w rozpatrzonym przykładzie przy założeniu prawidło- 
wych kości wynosi 3.6%, przy założeniu zaś wykrzywionych 
1.4% a więc z górą dwa razy mniej. Zgodność jest tym lepsza, 
im podany powyżej stosunek jest mniejszy. 

Drugie zagadnienie jest bardziej zawiłe. Pearson za- 
proponował jego rozwiązanie przez użycie innego sposobu 
określenia zgodności między szeregiem a funkcją, mianowicie 
przez użycie funkcji y*, której wartości oblicza się w sposób 


następujący. Od częstości każdej wartości wariantów (f;) obej- 
muje się odnośną wartość funkcji (y;), różnicę podnosi się do 
kwadratu i dzieli się przez wartość funkcji. Otrzymane w ten 
sposób liczby dodaje się i dzieli przez wartość funkcji. Jest to 
wartość funkcji y” dla danego szeregu obliczana według rów- 


nania: 


SA (f, A 
w którym l jest liczbą wartości wariantów, nie liczbą wa- 
riantów! 

Im większa jest zgodność między szeregiem a funkcją, 
tym mniejsze jest y”. Następnie, mając wartość tej ostatniej 
funkcji dla danej próby, oblicza się, jaka część wszystkich 
możliwych prób wziętych z rozpatrywanej populacji da war- 
tości równe i większe. Im większa część wypadnie, tym jest 
prób mniej zgodnych z funkcją niż próba dana. Jeżeli takich 
prób mniej zgodnych będzie dostatecznie dużo, będzie można 
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uznać, że funkcja została dobrana udatnie, w przeciwnym ra- 
zie trzeba będzie wybrać inną funkcję. Mamy tu rozumowanie 
podobne do tego, z jakim spotkaliśmy się przy rozpatrywaniu 
wiarogodności charakterystyk dla małych prób (ust. 31). Prze- 
prowadzenie tego rozumowania jest bardzo zawiłe i dlatego 
nie będę go podawał, odsyłając czytelnika do podręczników 
Fishera, Romanowskiego i Andersona. 

Zgodność między szeregami a funkcjami będziemy nadal 
określali prostym sposobem podanym na początku. Do tego 
jeszcze dodam, że pewną charakterystykę zgodności daje także 
maksymalna wartość odchyleń a zwłaszcza rozkład znaków 
+ i — w ciągu odchyleń: pomieszanie znaków świadczy o wię- 
kszej zgodności szeregu z funkcją niż rozdział ich. I jeszcze 
jedno: ważną jest rzeczą, żeby ciągi częstości obserwowanych 
i obliczonych „chwytały się końcami”, to znaczy, żeby duża 
zgodność była dla najmniejszych i największych częstości. Dla 
pośrednich częstości można natomiast dopuścić większe różnice. 

Jako drugi przykład wyrównywania szeregów rozdziel- 
czych za pomocą szeregu dwumianowego, rozpatrzymy dane 
Geisslera co do ilości chłopców w niemieckich rodzinach 
mających ośmioro potomstwa. Materiał obejmował 53680 ro- 
dzin (tab. 34.2). 
| Tabela 34,2 
Liczby rodzin Liczby te 


z takimi ilościami obliczone Różnice 
chłopców teoretycznie 


Ilości 
chłopców 


0 215 165 +50 
1 /'1485 1402 -- 83 
2 5381 5208 + 128 
3 10649 11035 . —386 
4 14959 14628 381 
5 11929 12410 —481 
6 6678 6580 +98 
7 2092 1s 1994 1-98 
8 342 264 


Ogółem 53680 53681 
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W tym zagadnieniu mamy ogółem 221019 chłopców na 
429440 dzieci. Zatem prawdopodobieństwo urodzenia chłopca 
wypada 0.51467, nieco większe niż urodzenia dziewczyny. 
Według tej wartości prawdopodobieństwa zostały obliczone 
liczby trzeciej kolumny za pomocą wzoru 


5368 (0.48533 + 0,51467)* 


Zostało to uskutecznione w przypuszczeniu, że płeć jednego 
dziecka jest niezależna od płci drugiego. Odchylenia liczb ob- 
serwowanych od obliczonych są na ogół tego samego rzędu 
wielkości co w poprzednim przykładzie. Ujemne wartości są 
pomieszane z dodatnimi. Wskazywałoby to na przypadkowość 
odchyleń, gdyby nie dziwne ujemne odchylenia o 3 i 5 chłop- 
cach. Są to największe odchylenia i jedyne ujemne! Kryje się 
tu działanie jakiejś określonej przyczyny, zwłaszcza, że te 
ujemne odchylenia dotyczą wartości zmiennej ewentualnej nie 
byle jakich, lecz określonych — mianowicie położonych syme- 
trycznie względem wartości modalnej. Pochodzi to być może 
z tej przyczyny, że powody w tej samej rodzinie nie są odnoś- 
nie do płci zdarzeniami niezależnymi od siebie. Stopień zgod- 
ności wynosi 3.2%. 


35. Wyrównywanie szeregów rozdzielczych za pomocą nor- 
malnej funkcji prawdopodobieństwa. Spotyka się czasem szeregi 
rozdzielcze, dla których wskaźnik skośności drugiego rodzaju 
(yı) oraz eksces (7) są małe. Takie szeregi można wyrównywać 
za pomocą normalnej funkcji prawdopodobieństwa (ust. 25). 

Klasycznym przykładem są tu materiały statystyczne do- 
tyczące wzrostu ludzi, np. materiał szwedzki przytoczony 
w ust. 6 (tab. 6,1).- Wartości wzrostu są w nim zgrupowane 
w przedziałach centymetrowych. Trzeba je traktować tak, jak 
gdyby pomiary były wykonane w milimetrach. Do wyrówny- 
wania szereg jest-za długi. Skrócimy go, łącząc klasy po dwie 
(tab. 35,1). Na tej podstawie otrzymamy charakterystyki: 
m — 86.115, o =2.9692, y, =+ 0.1185 + 0.0113, y, = —0.0425 -- 
+ 0.0226. 


Tabela 35,1 


Wzrost Szwedów 


Zair oey AEE Numery klas Częstości 


w mim 
Ai c 


1510-— 75.975 
1530— 76.975 
1550— | 77.975 
1570— | 78.975 
1590— | 79.975 
1610-— 80.975 
1630— 81.975 
1650— 82.975 
1670— 83.975 
1690— 84.975 
1710— 85.975 
1730— 86 975 
1750— 87.975 
Torea 88.975 
1790— 89.975 
1810—- - 90.975 
1830— 91.975 
1850— 92.975 
187037 :-1ajv) «683/938 
1890— 94.975 
1910— 95.975 
1930— 96.975 
1050— 97.975 
1970— 98.975 


Ogółem | 46981 


„Metoda porównywania szeregu rozdzielczego z normalną 
funkcją prawdopodobieństwa była już objaśniona w ust. 25 
dla szeregu dwumianowego. Widzieliśmy, że są dwie jej od- 
miany: jedna za pomocą całki Laplace'a przez porówny- 
wanie pól, druga za pomocą funkcji de Moivre'a przez po- 
równywanie rzędnych. W jednej i drugiej trzeba wprowadzić 
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do szeregu normalną formę dla zmiennej ewentualnej według 
równania 

+. X—m 

n a Dias: 

Przeprowadźmy z początku wyrównanie szeregu za po- 

mocą całki Laplace'a. Trzeba będzie w tym celu wyznaczyć 
` granice klas i po nadaniu formy normalnej dla zmiennej ewen- 
tualnej wybrać z tabeli B wartości całki dla wartości granic. 
Kolejne odejmowanie wartości dla całki da nam częstości 
względne dla poszczególnych klas. Mnożąc je przez liczebność 
szeregu otrzymamy teoretyczne częstości bezwzględne. Tok 
obliczeń jest zestawiony w tabeli 35,2, wyniki w tabeli 35,3. 
Z tej ostatniej wynika zgodność częstości obserwowanych z te- 
oretycznymi w wymiarze 3,2%. Granice klas w tabeli 35.2 
są oznaczone literą z. 


Tabela 35,2 


f 


Porównanie: wzrostu Szwedów z całką Laplace'a (Q) 


| Ę | Częstości 


X =m | st | Q względne 


obliczone 


75.975. | 75.475 | —10.640 0.0001 
0.0005 
76:975 | 76.475 | —9.640 0.0006 
0.0012 
72.975 | 77.475 | —8.640 0.0018 JU 
| 0.0033 
78.475 | —7.640 0.0051 6 
78.975 | 0.0075 
79.475 | —6.640 0.0126 
79.975 0.0161 
80.475 | —5.640 0.0287 
80.975 | 0.0307 
81.475 | —4640 0.0594 


Zadania i metody statystyki 
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Tabela 35,2 (dokończenie) 


Porównanie wzrostu Szwedów z całką Laplace'a (Q) 


| | | 


| Książ | Częstości 
X o4X=m' | Esm Q: | względne 
| z | obliczone 


81.475 | —4640 | —156 | 0.0504 7" 
| 0.0499 
i 82.475 | —3.640 | —1:23 0.1093 
N 82.975 | | wA 0.0774 
83.475 | —2640 | —0.89 0.1867 
| 83.975 | 0.1045 
5 84,475 | - —1.640- | —0.55 0.2912 CE: 
| 84.975 | 0.1217 
| 85.475 | —0.640 | —0.22 0.4129 
| 85.975 | 0.1349 
A 86.475 | --0.360 | -+0.12 0.5478 
| 86.975 0.1294 $ 
| 87.475 | --1.360 | *-1-046 0.6772 1 
| 87.975 0.1080 
| w EE 098.475 -| 22360]  -E0.79 * | 0.7852 | * 
88.975 0.0856 
| 89.475 | --3.360 | -+1.13 0.8708 
| 89.975 . | 0.0584 
l 90.475 |. -4.860 | -1.47 0.9292 
R 90.975 . 0.0357 
| : 91.475 | --5.360 | -1.81 0.9649 
| 91.975 i 0.0189 
| 92.475 | -16.360 | --2.14 0.9838 
i 92.975 0.0096 
93.475 | -47.360 | -+2.48 0.9934 
93.975 0.0042 
4 94.475 | --8.360 | -1-2.82 0.9976 
f 94.975 0.0015 
4 95.475 | --9.360 | --3.15 0.9991 
|. 95.975 0.0007 
| 96.475 | --10.360 | ---3.49 0.9998 
96.975 | 0.0001 
97.475 | -11.360 | --3.83 0.9999 | 
| 97.975 | | że 0.0001 
98.475 | --12.260 | --4.16 1.0000 
| 98.975 BoE | - 0.0000 
99.475 | --18.860 |  --4.50 1.0000 |- 


Tabela 35,3 


Porównanie wzrostu Szwedów z całką Laplace'a 


Zakresy klas | Częstości 16M 
E ~ Różnice 


w mm obserwowane | obliczone 


1510— : 23 
1530— | 56 
1550— | 

1570— 
1590— 
1610— 
1630— 
1650— 
1670— 
1690— 
1710— 
1780— 
1750— 
1770— 
1790— 
1810— 
1830— 
1850— 
1870— 
1890— 
1910— 
1930— 
1950— 
1990— 


Ogółem 


Przeprowadźmy następnie porównanie szeregu z nor- 
malną funkcją prawdopodobieństwa za pomocą funkcji de 
Moivre'a. Tak jak to jest pokazane w tabeli 35,4, nadajemy 
zmiennej ewentualnej formę normalną. Z tabeli A wybieramy 
odnośne wartości funkcji de Moivre'a. Będą to wartości 
zmiennej normalnej 7, która jest związana z częstościami y 


f Š 
równaniem y=yo' Stąd wypada y=—, a częstości bezwzględne 


. f . . . . E 
obliczymy z równania f =n—,, gdzie n jest liczbą wariantów. 
5 | 


Zgodność, jak to widać z tabeli 35,5 wypada równa 2.4%, 


12% 
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a więc lepsza niż przy stosowaniu całki Laplace'a. Zwykle 
bywa odwrotnie. 


Tabela 35,4 , 
Porównanie wzrostu Szwedów z funkcją de Moivre'a 


_ 75.975 —10.140 
76.975 — 9.140 
77.975 8.140 
78.975 7.140 
79.975 6.140 
80.975 5.140 
81.975 4.140 
82.975 3.140 
83.975 2.140 
84.975 1.140 
85.975 0.140 
86.975 - 0.860 
87.975 - 1.860 
88.975 - 2.860 
89.975 -- 3.860 
90.975 -L 4.860 
91.975 L 5.860 
92.975 -- 6.860 
93.975 - 7.860 
94.975 -L 8.860 
95.975 -L 9.860 
96.975 --10.860 
97.975 --11.860 
98.975 -|-12.860 


Dla kontroli obliczeń dobrze jest dodawać częstości 
względne otrzymane z całki Laplacea — suma powińna 
wypaść bliska jedności. W naszym przykładzie otrzymujemy 
0.9999. Dla kontroli drugiej odmiany metody trzeba dodać 
wartości p funkcji de Moivre'a. Suma powinna być bliska 
wartości średniego odchylenia szeregu. W naszym przykładzie 
ta suma wynosi 2.9796 podczas gdy o — 2.9692. 
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i Tabela 35,5 
Porównanie wzrostu Szwedów z funkcją de Moivrea 


Zakresy klas | Częesgkości._ 5 Różnice 
w mm | obserwowane | obliczone | 
1510— 
1580— 
1550— 
1570— 
1590— 
1610— 
1630— 
1650— 
1670— 
1690— 
1710— 

` 17380— 
1750— 
1770— 

11790— 
1810— 
1830— 
1850— 
1870— 
1890— 
1910— ; 
1930— 
1950— 
1970— 


; 46984 
Ogółem 1558 


` 36. Funkcje typu A. Jeżeli charakterystyki 7, i y% szeregu 
rozdzielczego mają znaczne wartości, normalna funkcja praw- 
dopodobieństwa nie nadaje się do wyrównywania. Jeżeli szereg 
jest dwuboczny, ale niezbyt silnie odbiega od formy normal- 
nej, najlepiej jest użyć funkcyj Charlier'a typu A. Dla 
szeregów dwubocznych silnie odbiegających od formy normal- 
nej trzeba natomiast użyć funkcyj typu B, tak jak dla szere- 
gów jednobocznych. Będzie o tym mowa w następnym ustępie. 


Funkcje Charliera typu A są to nieskończone sumy 
funkcyj, które przy użyciu współrzędnych normalnych mają 
formę: 

(6) F %(6) F cs Ps (6) ---C, 9, 6) 
gdzie ©, (£) jest funkcją de Moivre'a a  %;(-)9,(3) ... są to 
pochodne tej ostatniej trzeciego, czwartego itd. rzędów. Wy- 
starcza z powyższej sumy wziąć pierwsze trzy wyrazy. Rachu- 
nek nieskończonościowy pozwala określić formę pochodnych, 
które tu wchodzą, mianowicie: 


pE = Po — (— 424 36)9,0) 


4 é 
pO nO eleet a pE 

W końcu książki są podane w tabelach C i D wartości 
tych funkcyj dla wartości € w odstępach 0.01 z czterema zna- 
kami dziesiętnymi. Na razie przytaczam dla orientacji zesta- 
wione w tabeli 36,1 wartości Q;(ć) i g,(ć) dla wartości $ 
w odstępach 0.5. Rycina 9 przedstawia formę omawianych 
funkcyj. 
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Ryc. 9. Funkcje. p, (linia ciągła) i o, (linia przerywana). 
Na osi odciętych zaznaczone wartości zmiennej niezależnej £, 
(Według Charliera). 


Tabela 36,1 
Pa (È) 


0.0000, <- 0.0000 
--0.0070 |  --0.0218 
--0.0288 -0.0694 
-0.0708 --0.1330 
--0.1424 -0.0800 
--0.1080 | 0:2700 
—0.1457 |  —0.7048 
—0.4839 |  —0.4839 
—0.4841 -0.5501 


0.0000 | --1.1968 


-40.4841 -0.5501 
-0.4841 —0.4839 
-401457 —0.7043 
—0.1080 —0.2700 
—0.1424 -0.0800 
—0.0798 — 0.1330 
—0.0283 -10.0694 
—0.0070 -40.0218 

0:0000 - 0.0000 


Rachunek całkowy pozwala obliczyć :dla funkcyj typu 4 
średnią arytmetyczną i momenty drugiego, trzeciego i czwar- 
tego stopnia. Otrzymuje się: 


m=0 

Ma ZI 

M; = — 6C; 
m, =24 Cęy*3 


Dla porównania szeregu rozdzielczego z funkcją typu A 
trzeba wprowadzić do niego współrzędne normalne- według 
P e BE bilis i U BER f A 

G: A ADS 


c—+m 


5 


równań = 


s 1 2A względnie. $ = 


184 $.36 


Wtedy jego Średnia arytmetyczna stanie się równa zeru, 
moment drugiego stopnia stanie się równy jedności, moment 
trzeciego stopnia przybierze wartość wskaźnika skośności 
drugiego rodzaju (7) a moment czwartego stopnia — wartości 
ekscesu (y) powiększonego o 3. W ten sposób ażeby charak- 
terystyki funkcji typu A były równe odnośnym charakterysty- 
kom szeregu, współczynniki C, i C, powinny czynić zadość 
równaniom; 
—6C; = 7, 
- 24 Cta = Nn +3 


Stąd dla nich otrzymujemy wzory: 


LARA a 
5h C= Pte: 

Wprowadzenie współrzędnych normalnych jednocześnie 
przyrównuje średnią szeregu i jego moment drugiego stopnia 
odnośnym charakterystykom funkcji. 

Porównywanie szeregu z funkcją może być przeprowadzone 
obu metodami użytymi w poprzednim ustępie. Wystarcza 
jednak porównywanie rzędnych. Unika się przez to złożonych 
rachunków, które nie przynoszą należytych korzyści. 

Zastosujmy wyłożoną powyżej metodę do konkretnych 
materiałów statystycznych. Zaczniemy od wielokrotnie trakto- 
wahego materiału bławatka, zgrupowanego trzecim sposobem. 
Weźmiemy go w formie poprawionej na zasadzie kryterium 
Chauveneta bez krańcowego plus wariantu. Będziemy mieli 
dla niego charakterystyki: m = 11.547, o = 1.9053, y; = + 0.5088, 
Ya = + 0.4464 i otrzymamy c= — 0.0848; “`c, = + 0.0186. 
Obliczmy wartości funkcji 9, (6) i m () dla poszcze- 
gólnych wyrazów naszego szeregu (tab. 36,2). Widzimy z po- 
równania częstości obliczonych, i obserwowanych. (tab. 36,3), 
że: „użycie funkcji 9.6) dało wynik. lepszy niż przy, funkcji 
pò: (6). Wypada mianowicie stopień zgodności w pierwszym 
przypadku jest 11.2%, w drugim zaś 14.4%. O lepszej zgodności 


A jura: 57 


Tabela 36,2 
Liczby kwiatów w koszykach bławatka 


3 
C4 F4 


0.0347 | --0.1445 | —0.0840 | —0.0127 | —0.0016 0.0208 
0.0957 | -+}+0.0233 | —0.5720 | -0.0020 | —0.0107 0.0807 
0.2036 | —0.3907 | —0.6642 | —-0.0331 | —0.0124 0.2243 
0.3251 | —0.5389 | —-0.2309 | --0.0457 | —-0.0048 0.3751 
0.3965 | —0.1308 | 1.1609  —-0.0110 | --0.0216 0.4291 
0.3668 -0.4259 | —-0,7408 | —0.0361 | —-0.0138 0.3445 
0.2565 -0.5102 | —0.3901 | —0.0433 | —0.0078 0.2059 
0.1374 | —-0.1742 | —0.7209 | —0.0148 | —0.0134 0.1092 
0.0551 | —0.1052 | —0.2797 | —-0.0089 | —0.0052 0.0588 
0.0171 | —0.1416 | —-0.0836 , —0.0120 | —-0.0016 0.0307 
0.0040 | —0.0746 | —-0.1290 | --0.0068 | -0.0024 0.0127 
0.0007 | —0.0244 | —-0.0680 | --0.0021 —-0.0013 0.0041 


1.8932 | 1.8959 


eco 
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Tabela 36,3 


Liczby kwiatów w koszykach bławatka 


Zakresy 
klas 


21— 
24— 
20 
30— 
33— 
36— 
39— 
42— 
45— 
48— 
Dic 
54— 


Ogółem j „512299 >| 7-198 —22.8 | t7160 —17.6 


przy użyciu funkcji Q(6) świadczy także wymiar poszczegól- 
nych odchyleń, który wynosi najwyżej 5.1, podczas gdy przy 
funkcji ©, (6) dochodzi do 10.0. Zgodność jest zresztą mierna, 
co jest skutkiem małej liczebności próby. Według Charliera 
wogóle nie warto przeprowadzać wyrównywania szeregów 
przy mniej niż tysiącu wariantów w próbie, a tu było za- 
ledwie 299. . 

Na przykładzie bławatka spróbujmy za pomocą wyrówna- 
nia szeregu określić wartość modalną. Mieści się ona gdzieś 
w środku szeregu. Trzeba wobec tego obliczyć wartości funkcji 
o (6) dla poszczególnych najczęstszych wartości zmiennej ewen- 
tualnej. W tabeli 36,4 jest przedstawiony tok obliczeń. Wypada 
z nich, że najczęstszą jest wartość x = 34, a więc liczba z sze- 
regu Fibonacciego. Nie jest to wynik pewny z uwagi 
na małą liczebność materiału. i 


10*/; 


—1.214 
—0.880 
—0.547 
—0.214 
--0.120 
-10.453 


| -0.786 


Tabela 36,4 


Liczby kwiatów w koszykach bławatka 


Qo 


0.3251 
0.3589 
0.8825 
0.3965 
0.3982 
0.3876 


0.3668 


—0.5389 | --0.2309 
— 0.4603 | --0.6371 


—0.3235 | -—0.9572 | - 
—0.1303 | --1.1609 | - 


0.0716 | -1.1861 
--0.2737 | 1-1.0302 


|--0.4259 | --0.7408 


Cs Tą 


10.0457 |---0.0043 
-0.0390 |--0.0119 
10.0274 | --0.0178 
-0.0110 |---0.0216 
—0.0061 |---0.0221 


—0.0232 |--0.0192 |. 


—0.0361 | —-0.0138 


0.3751 
0.4098 
0.4277 
0.4201 
0.4142 
0.3836 
0.3445 


$ 36 


Daleko lepsze wyniki wyrównania da drugi materiał, jaki 
rozpatrzymy — materiał dotyczący wskaźnika głównego 
szwedzkich rekrutów z lat 1897 i 1898, ogłoszony w r. 1902 
przez Petriusa i Fiirsta (tab. 36,5). Zapożyczam go 
z książki Charliera. Mamy tu 22505 wariantów. 

Wskaźnik główny jest to stosunek szerokości czaszki do 
jej długości. Wyraża się go w setnych częściach. 


Tabela 36,5 


Wskaźnik główny szwedzkich rekrutów (setne części jedności) 


Zakresy klas. Ich częstości 


— 


65—66 | | "2 
67—68 3 87 
69—70 510 
EE A 1952 
73—74 4346 
75—76 6039 
77—78 - 5050 
9-80 203 282: 
81—82 
83—84 
85—86 
87—88 
89—90 


Ogółem” 


Charakterystyki tego drugiego szeregu są następujące: 
m =38.029, 0 =1.5176, 7,==+0.2558  7ę= 0.3901. Stąd 
otrżymamy: c; = — 0.0426, c, = + 0.0163. W tabelach 36,6—7 
są podane szczegóły rachunków. Tabela 36,8 daje zestawienie 
częstości obserwowanych i obliczonych. Wypływa z niej że sto- 
pień zgodności wynosi przy użyciu funkcji o (6) 3.4%, przy 
użyciu zaś funkcji ©, (6) 5.5%. 


Zakresy 
klas | 


65—66 | 
67—68 

69—70 
71—72 | 
73—74 | 
75—76 | 
77—78 

79—80 
81—82 | 
83—84 | 
85—86 | 
87—88 
89—90 


—3.48 
—2.82 
—2.16 
—1.50 
-- 0.84 
—0.18 
-0.48 
-1.13 
1.79 
2.45 
3.11 
3:77 
-1-4,43 


Tabela 


36,6 


Wskaźnik główny szwedzkich rekrutów 


32.75 
33.75 
TOAD 
35.75 
36.75 
37.75 
38.75 
39.75 
40.75 
41.75 
42.75 
43.75 
44.75 


—5.279 
— 4.279. 


Tabela 


c" i m 


36,7 


Wskaźnik główny szwedzkich rekrutów 


Ps 


-0.0298 

-0.1045 
-40.1393 
—0.1457 
—0.5403 
| —0.2097 
-40.4726 
- 0.4102 
| —0.0294 
| —0.1459 
| —0.0657 
| 


| —0,0139.| 


| —0.0016 


c,P; 


—0.0013 
-0.0044 
—0.0059 
-|-0.0062 
--0.0230 
10.0089 
—0.0201 
—0.0175 
-0.0012 
0.0062 
0.0028 | 

+ 0.0006 


0.0001 | 


Pi 


0.1386 
—0.1249 | 
—0.7043 
—0.2063 
-1.1017 

-0.5940 | 
—0.6386 | 
—0.4789 | 
— 0.0598 | 


0.1219 | 


0 0394. -40.0006 | 


0.0060 | 


C4P1 


-0.0721 | —-0.0012 : 


--0.0023 
—0.0020 
—0.0114 
—0.0034 
-|-0.0179 
--0.0097 
—0.0104 
—0.0078 

0.0010 

0.0010 


0.0001 


p 


0.0009 
0.0054 
0.0308 
0.1243 
0.2999 
0.4193 
0.3451 
0.1828 
0.0738 
0.0270 
0.0080 
0.0018 
0.0002 


Tabela 36,8 
Wskaźnik główny szwedzkich rekrutów 


| Częstości | Częstości obliczone | Różnice 3 
Zakresy | Obserwo- | A 
wane 
klas 


z 


65—- 
67— 
69— 
Tis 
13s 
(b= 
Tise 
79— 
81— 
83— 377 
85— 94 


81— 51.0) d 20 
89— 13 ady 


22505 | 2250: 22512 


Ogółem 


Jako trzeci przykład przytaczam (tab. 36,9) szereg opra- 
cowany przez J. Witkowskiego, dotyczący błędów obser- 
wacyjnych rektascencji gwiazd. (tab. 6,8). Charakterystyki są 
tu następujące: m’ = + 0.133, © — 1.967, cz= + 0.004, c, = 
=— 0.017. Były one obliczone bez poprawki Shepparda. 
Zgodność częstości obserwowanych i obliczonych wynosi 4.71%. 

Dodatkowo warto jest zauważyć, że opracowany w po- 
przednim ustępie materiał wzrostu Szwedów wymaga właści- 
wie zastosowania funkcji typu A. Wskazuje na to rozkład zna- 
ków przy różnicach między częstościami teoretycznymi i obser- 
wowanymi. Pozostawiam czytelnikowi sprawdzenie. 


Tabela 36,9 


Błędy obserwacyj rektascencji gwiazd 


| 4 : 
Wartość środkowa | Gw .ęw toś ci 
klas FA I 


g Ey = Różnice 
obserwowane obliczone | 


n A0) 6 
—0.75 ? | 172 
—0.60 289 
—0.45 741 
—0.30 1386 
—0.15 1983 

0.00 2374 
--0.15 y 2121 
-+0.30 1585 
+0.45 910 
--0.60 3: 380 
sAr 102 
-+0.90 | 12 


11961 


Ogółem 


37. Funkcje typu B. Do wyrównywania szeregów jedno- 
bocznych a także dwubocznych silnie odbiegających od formy 
normalnej trzeba uciec się do funkcji Charliera typu B. 
Wywodzą się one z szeregu Poissona, stanowiąc pewnego 
rodzaju uogólnienie tego szeregu. Ogólny wzór tych funkcyj 
ma formę nieskończonej sumy: 


y(x) ząb p(x) Ę k A? p(x) z k, 4” p(x) Z 5 RATĘ 


W nim y(x) jest to znana już nam z ust. 26 funkcja 
Poissona 


A — 
p = Ze 


x. 


A 


ky, ka... Są to stałe spółczynniki a A*4%(x), A4%,(%x)... 
przyrostami funkcji drugiego, trzeciego itd. stopnia. 


Oblicza się te przyrosty według wzorów: 
A 4% (x) = p(x) Ti plx 1) 
RE =A x a E a =, x —2606— 1) -- E — 2) 
4? W(x) = A? 4,(x) — A p(x — 1) = %(x) 3 p(z — 105 
l- 3 p(x =" 2) Aka Pal „a 


Z sumy określającej funkcję typu B bierze się ograniczoną 
liczbę wyrazów. Zależnie od formy szeregu rozdzielczego, który 
ma być wyrównany, bierze się jeden, dwa lub trzy wyrazy. 
Charlier brał dwa wyrazy. Dodanie trzeciego wyrazu nie 
było dotychczas, o ile mi jest wiadome, przez nikogo stoso- 
wane. ') 

Według zasady wyłożonej w ust. 33 funkcja, która ma 
służyć do wyrównania szeregu, powinna mieć średnią i mo- 
menty równe odnośnym charakterystykom szeregu. W zasto- 
sowaniu do rozpatrywanego zagadnienia będzie tu chodziło po- 
za Średnią o momenty drugiego i trzeciego stopnia. Moment 
czwartego stopnia byłby potrzebny tylko wtedy, gdyby się 
wzięło czwarty wyraz w nieskończonej sumie vy (x). Ale to 
jest bezcelowe. 

Dla funkcyj typu B otrzymuje się metodą, zastosowaną 
w ust. 26 do szeregu Poissona, następujące charakterystyki: 

m =å 

M = y A e 2k, 

Ms = „dn: 6k, err 6k, 
Stąd otrzymujemy dla charakterystycznych stałych rozpatry- 
wanych funkcyj następujące wzory: 


j 3m, — m; = 2m 
3 — 6 


t) Zob. pracę autora tej książki pt. „Observations biomótriques.:VI*' 
(Acta Societatis' Botanicorum Poloniae. Tom. XVII (1946). 
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Przy: obliczeniach wartości funkcji typu B trzeba pamiętać 
„o tym, że dla ujemnych wartości zmiennej niezależnej funkcja 
Poissona ma stale wartość zero. | 

Przy stosowaniu funkcyj typu B do wyrównywania szere- 
gów jednobocznych nie trzeba wprowadzać współrzędnych nor- 
malnych. Trzeba natomiast przenieść początek współrzędnych 
dla zmiennej ewentualnej tak, żeby wartość jej mająca naj- 
większą częstość równała się zeru. I tak dla liczby płatków 
w szczytowych kwiatach jaskra płożącego się (Ranunculus 
repens) mamy szereg (tab. 6,10): 


5 6 ti 8 9 10 
56 26 13 


Nadajemy mu formę: 


0 1 2 
314 56 26 13 


Funkcje typu B dają częstości względne, które przeracho- 
wujemy na bezwzględne mnożąc je przez liczbę wariantów. 

Przeprowadźmy wyrównanie przytoczonego powyżej sze- 
regu jaskra płożącego się. Obliczamy jego charakterystyki: 
m = 0.3971, Mm, = 0.6898, m; = + 1.3721, Stąd wypada A = 0.3971, 


e 1—0.6723, ka= + 0.1463, k, =—0.0161. W tabeli 37,1 są 
zestawione przeliczenia w dziesięciotysięcznych. Przerachowu- 
jąc otrzymane częstości względne na bezwzględne (n = 413), 
otrzymujemy zestawienie wartości teoretycznych i obserwowa- 
nych (tab. 37,2). Zgodność wypadła doskonała, stopień jej 
jest 0.08%. 

W wielu przypadkach trzeba pominąć trzeci wyraz funk- 
cji y (x). Na przykład dla liczby płatków u przylaszczki (An e- 
mone Hepatica) (tab. 6,10) lepszy wynik otrzymuje się 
z dwoma wyrazami niż z trzema. Pozostawiam czytelnikowi 
przeprowadzenie obliczeń. 


Zadania i metody statystyki 


$ 37 


Tabela 37,1 


Liczby płatków w szczytowych kwiatach jaskra płożącego się 


c Po x | A? 9, Wy, |kzA*wy, k; Apo] y 


6723 | - -+ 6723 | -i + 984| —108| 7599 
2670 —10776 —1577| 282) 1375 
530 + 1913 | - + 280| —204/ 606 
70 + 1680 + 246| +. 4| 320 
k "+ 397 A o ni | 86 
0 FP, DB FS RER 


| 10000 | eaen =S 
| | +1576| +312 


> 


Tabela 37,2 


Liczby płatków u jaskra płożącego się 


Ich częstości 
Liczba płatków |——— i Różnice 
i obliczone | _ obserwowane 


—0.2 

-0:8 
2946 
| —0.2 
, -L0.6 
1 : —05 


| R 


Ogółem | 0.16 


Czasem dla wyrównania szeregu trzeba ograniczyć się do 
pierwszego wyrazu funkcji w (x), to znaczy wziąć po prostu 
funkcję Poissona. Klasycznym tego przykładem jest ma- 
teriał wypadków śmierci od kopnięcia konia w armii pruskiej, 
opracowany. przez Bortkiewicza (tab. 6,13). Tu m= 
= A= 0.61, eà = 0.5433. W tabeli 37,3 są zestawione częstości. 
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Wymiar zgodności wynosi 2.4%. Jest ona gorsza niż w po- 
przednich dwóch wypadkach. 


Q 


Tabela 37,3 


Wypadki śmierci od kopnięcia konia w 20 korpusach 
armii pruskiej w ciągu 10 lat 
| Częstości 


| Różnice 
obliczone obserwowane 


109 |-—03 
65 b 13 

| —18 

| 1.1 

—0.4 


| 
Ogółem | 199.9 | —2.5 --24 


Jak to było wzmiankowane na początku tego ustępu, funk- 
cje Charliera typu B mogą być także użyte do wyrówny- 
wania szeregów dwubocznych, jeżeli te szeregi silnie odbiegają 
od formy normalnej. Mamy dwa takie przypadki: w jednym 
szeregi są silnie skośne, w drugim poza skośnością, która zresztą 
bywa różna, częstość wartości modalnej znacznie przewyższa 
częstości sąsiednich wartości zmiennej ewentualnej. 

Dla ilustracji pierwszego rodzaju takich szeregów dwu- 
bocznych przytoczę przykład Charliera, jedyny zresztą, 
jaki przez niego został podany w: jego podręczniku. Dotyczy 
on częstości dni z burzami w sierpniu w Lund (tab. 6,12). Dla 
niego 4 = 2.133, k, = 1004 — użyte tu są dwa wyrazy funkcji 
w (x). W tabeli 37,4 są zestawione częstości obserwowane 
i obliczone. Zgodność wypadła mierna: wymiar jej wynosi 
13.6% a oprócz tego ciągi częstości nie bardzo się „trzymają 
końcami”. i y 
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Tabela 37,4 


Dni z burzami w sierpniu w Lund 


Częstości 


Liczby dni ai f 
obserwowane | obliczone 


24 | 24.8 


26 | 28.2 
19 | 
13 


= oO OoN A wN e o 
MHOCONDYUIOW 


1 
1 


j 
© 
or 


Ogółem 


Jako drugi przykład, przytoczę ciekawy materiał Stu- 
denta podany przez Fishera w jego podręczniku, Obser- 
wowano pod mikroskopem zawiesinę drożdży i liczono komórki, 
które znalazły się w 400 małych kwadratach, na jakie był pe- 
dzielony 1 mm* na szkiełku przedmiotowym. Jest to zasada, 
na której opiera się użycie hematocymetru, przyrządu 
służącego do określenia liczby ciałek krwi. W tabeli 37,5 są 
zestawione obserwowane i obliczone częstości poszczególnych 
liczb komórek. Obliczenia przeprowadzono za pomocą samej 
tylko funkcji Poissona, dla której w tym przypadku Å= 
= 4.68, e * = 0.009279. Zgodność wypadła mierna. Jej wymiar, 
równy 9.6%, jest wprawdzie lepszy niż w poprzednim przy- 
padku, ale „trzymanie się końcami” przedstawia się gorzej. 


pe nne a 


Z 
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= 
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Tabela 37,5 


Komórki drożdży obserwowane w hematocymetrze 


Ich częstości 
| Różniee 


Liczby komórek 
obserwowane | obliczone 


| 


f 
f 


f 
| 
| 
f 


Kofe En orgo E N MO 


—18.9 


Ogółem | | 
ż | | +19.3 


Przechodzimy w końcu do rozpatrzenia wyrównywania 
szeregów dwubocznych odznaczających się wybitną częstością 
wartości modalnej, poza tym zresztą zwykle dosyć silnie asy- 
metrycznych. W ust. 6, 7 i 19 były przytoczone przykłady tego 
rodzaju szeregów. Między innymi taki szereg daje meduza 
Pseudoclytia pentata (tab. 6,5). Zastosowanie do nich 
funkcyj typu B wymaga gruntownej przeróbki odnośnych sze- 
regów rozdzielczych. Trzeba tu rozumować w sposób następu- 
jacy. W odnośnych zjawiskach są czynne trzy rodzaje przy- 
czyn. Pierwsza z nich działa stale i silniej od innych, powoduje 
przeto wyjątkową częstość wartości modalnej. Dwie pozostałe 
działają rzadziej i słabiej. Jedna z nich powoduje powiększe- 
nie zmiennej ewentualnej, druga zaś — pomniejszenie. Można 
wobec tego z danego szeregu wydzielić dwa nowe szeregi. Je- 
den z nich będzie charakteryzował działanie przyczyny po- 
mniejszającej zmienną ewentualną a drugi — działanie przy- 
czyny powiększającej tę zmienną. 
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Otóż dla liczb promieni u meduzy Pseudoclytia mieliśmy 
szereg rozdzielczy: i 
Liczby promieni: 2 3 4 5 6 7 8 
Ich częstości: 1 6 56 860 64 6 1 
Dla przyczyny pomniejszającej liczbę promieni wypada szereg: 
Działania przyczyny: 0 1 2 3 
Ich częstości: 931 56 8 1 
Weźmiemy w tym przypadku dwa wyrazy funkcji % (x). Otrzy- 
mamy: m = 0.0753, m, = 0.0917, 42=0.0753, e-—*==0.9275, 


k, = +0.0082. Zgodność wypada w wymiarze 0.3% (tab. 37,6) 
a więc bardzo dobra. 


Tabela 37,6 


Przyczyna pomniejszająca liczbę promieni meduzy 


Działania | 1.6D_0 z_ę 8. £-0.Ś,Czi 
— Różnice 


przyczyny obliczone | obserwowane 


931.4 931 
55.0 56 
"KENYA 8 
0.6 1 


- Ogółem 996.1 | 996 


Dla przyczyny powiększającej liczbę promieni otrzymamy 
szereg: A 


Działania przyczyn: 2 3 
lch częstości: 6 1 


Zastosujemy tu trzy wyrazy funkcji vy (x). Charakterys- 
tyki wypadną:  m—=0.0793,  m.=0.0911,  m,=0.11%0, 
k =+ 0.0059, ks =— 0.0004. Zgodność wypada w wymiarze 0.2% 
(tab. 37,7) a więc doskonała. 


Tabela 37,7 
Przyczyna powiększająca liczbę promieni! meduzy. 


|| 
Działania | Ich częstości 


| . 
| — - Różnice 
zyny | A 
W ZYNY | obliczone | < obserwowane i 


925.3 925 + 0.3 
63.7 | 64 —0.3 
6.2 6 +0.2 
kien 1 —09 


995.3 | 996 —1.2 
+ 0.5 
Przy zastosowaniu funkcyj B wypadają czasem rażące nie- 
zgodności między częstościami obliczonymi a obserwowanymi, 
powodowane przez skąpe warianty. Na przykład dla jaskra 
wielokwiatowego (Ranunculus polyanthemos) były przytoczone 
następujące częstości dla liczb płatków (tab. 6.10). 
Liczby płatków: 5 6 7 8 9 
Ich częstości: 410 16 1 0 1 
Charakterystyki. wypadną: m= 0.05140, M= 0.08148, 
m, = 0.19293, 1 —0.05140,  e7* = 0.9499, k= -+0.01504, 
k =-— 0.0855. W konsekwencji otrzymuje się częstości para- 
doksalne (tab. 37,8) — jedna z nich ujemna! 


Ogółem | 


, Tabela 37,8 
Liczby kwiatów płatków u Ranunculus polyanthemos. 
Ee hiie Tiasa ed 
Liczby płatków |— wieka. E a rka 
obliczone | obserwowane 


409.2 | 410 
19.2 16 
—4.3 
3.3 0 
0.2 


Ogółem 427.6 
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Jest to spowodowane. przeż napotkanie bardzo rzadkiego 
osobnika rośliny ż 9 płatkami. Wystarczy odrzucić ten wy- 
jatkowy wariant, by otrzymać doskonałą zgodność, jak to wi- 
dać z tabeli 37,9. Charakterystyki teraz są: m= 0.04215, 
m, = 0.04502, M, = 0.05044, _ə ‘GIZO 0O =Y k = 0.9585, 
ką = +0.00143. k, = +0.00005. Mamy tu nowy przyczynek do 
zagadnienia skrajnych wariantów, omówionego w ust. 32. 

W końcu dodatkowo trzeba jeszeze powiedzieć parę słów 
o wyrównywaniu szeregów wklęsłych, występujących prawie 
wyłącznie przy badaniach nad zachmurzeniem (por. tab. 6,14). 
Żadna z omówionych w tym rozdziale funkcyj nie nadaje się 
dla tej formy szeregów rozdzielczych. Pearson, układając 
funkcje do wyrównywania szeregów, nie pominął tej wyjątko- 
wej formy zmienności. Ponieważ to nie ma poważniejszego 
znaczenia, nie będę się tą kwestią zajmował. Czytelnik znaj- 
dzie odnośną funkcję Pearsona w książce Eldertona 
(zob. ust. 38). 


Tabela 37,9 


Liczby płatków u Ranunculus polyanthemos. 


I c hioerzięcako Ś/e l 
Liczby płatków wee p 
obliczone obserwowane 


410 
16 
1 


Ogółem | i A= 427. 


CZĘŚĆ DRUGA 
WSPÓŁZALEŻNOŚC MIĘDZY POPULACJAMI 


ROZDZIAŁ VII. 
KORELACJA 


38. Pojęcie korelacji. Współzależność między populacjami 
może mieć charakter korelacji i kontyngencji. 
Pierwsze zachodzi wtedy, kiedy warianty różnią się między 
sobą ilościowo, drugie — jeżeli różnice między wariantami 
w obu porównywanych populacjach albo przynajmniej w jed- 
nej z nich mają charakter jakościowy. 

Można porównywać ze sobą także nie dwie ale liczne po- 
pulacje. Wtedy zjawia się zagadnienie klasyfikacji, 
czego rozpatrywać nie będziemy. 

Jako przykłady korelacji można przytoczyć współzależność 
między liczbą kwiatów. języczkowych i rurkowych w koszy- 
kach roślin z rodziny złożonych (Compositae), współzależność 
między wzrostem ojców i synów, między wiekiem męża i żony 
itd. Jako przykłady kontyngencji można podać współzależność 
między barwą oczu a barwą włosów, między wypadkami 
śmierci od dyfterytu a stosowaniem szczepionki Behringa, 
między śmiertelnością a płcią itp. 

W tym rozdziale zajmiemy się zagadnieniem korelacji, 
odkładając kontyngencję do następnego rozdziału. W zagadnie- 
niu korelacji mamy, do czynienia z dwoma populacjami, za- 
zwyczaj z próbkami dwóch populacyj o jednakowej liczbie 
wariantów, przy czym każdemu wariantowi jednej 
odpowiada pewien wariant drugiej, dla każ- 
dego z nich inny, jakkolwiek niekoniecznie 
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odmienny. Takie powiązanie wariantów dwóch populacyj 
pochodzi bezpośrednio albo pośrednio z blizkości w czasie lub 
w przestrzeni przedmiotów czy zjawisk będących źródłem roz- 
patrywanych populacyj. Naprzykład korelacja między liczbami 
kwiatów rurkowych i języczkowych pochodzi stąd, że jedne 
i drugie bierze się z tych samych koszyków, korelacja między 
temperaturami dwóch miast pochodzi z jednoczesności obser- 
wacyj meteorologicznych. O ile chodzi o pośredni stosunek 
przestrzenny i czasowy, można przytoczyć korelację między 
wzrostem ojców i synów, między wiekiem męża i żony. Czy 
takie związki są przestrzenne czy pośrednie, zawsze istotnym 
ich źródłem są związki przyczynowe. Nie wynika z tego by- 
najmniej, by statystyka miała zajmować się badaniem przy- 
czynowości. Celem jej zawsze tylko opis, który zresztą może 
być użyteczny do badań nad przyczynowością. Stąd pochodzi 
równorzędne traktowanie obu porównywanych  populacyj 
w zagadnieniach korelacji. Na przykład statystyka rozpatruje 
równorzędnie zależności wzrostu synów od wzrostu ojców 
i zależność wzrostu ojców od wzrostu synów, jakkolwiek 
wzrost synów jest częściowo uwarunkowany przez wzrost 
ojców, natomiast na wzrost ojców wzrost ich synów nie ma 
żadnego wpływu. Przy rozpatrywaniu korelacji, tak samo 
zresztą jak kontyngencji, chodzi tylko o związki matematy- 
czne, funkcjonalne a nie przyczynowe. Dlatego właśnie 
mówi się o współzależności między populacjami a nie o za- 
leżności jednej od drugiej. 
Ustalmy teraz dokładniej zadanie badania korelacyjnego. 
Podałem powyżej, że każdemu wariantowi jednej populacji 
odpowiada pewien wariant drugiej, dla każdego inny. ale nie- 
koniecznie odmienny. Z reguły przy tym jest tak, że danej war- 
tości wariantów jednej populacji odpowiadają różne i to liczne 
wartości wariantów drugiej. To nas prowadzi do rozpatrywa- 
hia źwiązków nie pomiędzy poszczególnymi wariantami, lecz 
między wartościami wariantów. Trzeba znowu zrobić użytek 
z pojęcia zmiennej ewentualnej. ale będziemy tu mieli nie 
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jedną jak poprzednio zmienną tego rodzaju, lecz dwie — 
osobne w rozpatrywanych populacjach. | 

Niech będzie populacja, względnie próba z populacji, zło- 
żona z n wariantów uj, u»,...un. Przypuśćmy, że mają one k 
różnych wartości £i, Cs,..... , Cn, przy czym naturalnie h < n. 
Niech będzie druga populacja złożona tak jak pierwsza z n 
wariantów v;, v», , Un wykazujących l różnych warto- 
ŚCI Yı, Ya, «.:., Y gdzie L< n i nadto ż reguły LŒ h. Niech 
każdemu wariantowi u, pierwszej populacji odpowiada wariant 
vi drugiej. Zmienna x będzie zmienną ewentualną pierwszej 
populacji. zmienna y takąż zmienną drugiej. 

Chcąc teraz przedstawić za pomocą jakiejś funkcji zwia- 
zek między populacjami, nie będziemy tego mogli zrobić za 
pomocą samych tylko zmiennych x i y w formie y=], (x), 
x= fs (y). bo każdej danej wartości zmiennej x będą naogół 
odpowiadały różne wartości zmiennej y i odwrotnie. Trzeba 
będzie wprowadzić nowe zmienne X i Y a to w sposób nastę- 
pujący. Zmienna Y ma dla każdej wartości x 
przybierać wartość pośrednią między odpo- 
wiadającymi jej wartościami zmiennej y. Bę- 
dzie to pewna funkcja zmiennej x:Y—=f, (x). W podobny 
sposób dla zmiennej æ trzeba ustalić nową zmienną X zwią- 
zaną ze zmienną -y równaniem X= f(y) Warto jest 
przy tym zrobić uwagę, że funkcja f, nie jest od- 
wrotnością funkcji f,. Przytoczone powyżej równanie dla 
zmiennych Y i X noszą nazwę równań regresji. 
Termin regresji pochodzi stąd, że badanie korelacji zrodziło 
się z badań nad dziedzicznością. Mianowicie zapoczątkował je 
angielski biolog i etnograf Franciszek Galton w dziele 
pod tytułem „Natural Inheritance”, które ukazało się w r. 1889. 
Powodem wyboru tego terminu było stwierdzenie faktu, że 
potomstwo na ogół mniej odbiega od przeciętności niż jego 
rodzice, ulega więc uwstecznieniu — regresji, co ujawnia się 
przy badaniu korelacji między cechami potomstwa i rodziców 
Warto jest jeszcze zaznaczyć, że matematyczne podstawy ra- 


204 


chunku korelacyjnego wywodzą się z jednej z prac francus- 
kiego fizyka Augusta Bravais (1811— 1868), która uka- 
zała się w r. 1846. 

Jeszcze trzeba dodać jedno wyjaśnienie do pojęcia kore- 
lacji. W praktyce nigdy prawie nie ma się do czynienia z ca- 
łymi populacjami, tylko z próbami, nieraz o małej liczebności. 
Otóż jeżeli próby są małe, często się zdarza, że poszczególnym 
wartościom jednej zmiennej ewentualnej odpowiadają poje- 
dyncze wartości drugiej. Zagadnienie jednak pozostaje bez 
zmiany, gdyż zadaniem rachunku korelacyjnego jest badanie 
związku nie między próbami, lecz całymi populacjami. Przy 
małych próbach możnaby wprawdzie ustalić zwiążek funkcjo- 
nalny między zmiennymi ewentualnymi za pomocą wzoru 
interpolacyjnego Lagrange'a, ale to nie dałoby żadnego 
obrazu związku między populacjami. Trzeba i w tym wypadku 
wprowadzić owe zmienne Y i X i użyć równań regresji takiej 
samej formy, jak przy traktowaniu dużych prób. Nie można 
będzie wtedy powiedzieć, że zmienna Y przybiera dla każdej 
wartości x wartość pośrednią między odpowiadającymi jej 
wartościami zmiennej y w rozpatrywanym materiale staty- 
stycznym, bo w nim jest tylko jedna taka wartość. Zmienna Y 
będzie jednak przybierać wartości pośrednie między wartościa- 
mi y, ale między wartościami całości populacji, nie danego 
materiału. 

Forma funkcyj f, (x) i fẹ (y) może być różna i da się ogól- 
nie przedstawić w formie parabolicznej: 


fd) > rb BLE GAR OC GE 


fa (Y)= > + bzy t czy” t dzy* +.... 


W praktyce statystycznej wystarcza przeważnie skrócona 
forma liniowa | 


Ti ra aT J07E 


f (y) = 4: + bzy 
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i rachunki sprowadzają się do wyznaczenia dwu tylko współ- 
czynników dla każdej funkcji. 

Taka prosta forma równań regresji ma swoje źródło 
w tym, że zmienność wariantów w populacjach jest skutkiem 
działania licznych przyczyn, z których każda z osobna nie wy- 
wołuje wybitnych skutków. Jest to ten sam stan rzeczy, który 
powoduje, że zmienność da się przedstawić za pomocą okre- 
ślonych funkcyj, wywodzących się z szeregu dwumianowego. 

Uwzględnienie bardziej złożonych form równań regresji 
wymaga bardzo zawiłych rachunków i przeto nie może być 
omawiane w tej książce. 


39. Wyznaczanie stałych równania regresji. Zadanie to może 
być rozwiązane w rozmaity sposób. Jednakże jedno wymaga- 
nie musi być zawsze uwzględnione: mianowicie suma do- 
datnich odchyleń wariantów y od odnośnych 
wartości Y ma być równa sumieodchyleń ujem- 
nych, i tak samo suma dodatnich odchyleń zx 
od X ma być równa sumie odchyleń ujemnych. 

Najbardziej naturalnym rozwiązaniem rozpatrywanego 
zagadnienia byłoby znalezienie takich wartości dla współczyn- 
ników a i b, żeby wspomniane powyżej sumy były możliwie 
małe. Niestety, dla takiego rozwiązania nie można wyprowa- 
dzić żadnych ogólnych wzorów, a w poszczególnych przypad- 
kach trzeba by było wyszukiwać wartości współczynników przez 
mozolne próby, po trosze na chybi trafi. Trzeba szukać metod 
opartych na innej zasadzie. Powszechnie przyjętą jest m e t o- 
da najmniejszych kwadratów. Opiera się ona 
ra wymaganiu, by suma kwadratów odchyleń 
wariantówyododnośnych wartości Y (względ- 
nie x od X) była możliwie mała. Na tej zasadzie za 
pomocą rachunku nieskończonościowego można wyprowadzić 
wzory dla współczynników równań regresji. Jeżeli, tak jak to 
było podane poprzednio, warianty zmiennej ewentualnej x 
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oznaczymy przez u, warianty zaś zmiennej y przez v, 
te będą miały formę: 
>u’ io — Zu Aiie 

nżu — (Żu) 


a, 


BA — Zużbv 
np? — (25)? 


Równaniom regresji można nadać prostszą formę, w któ- 
rej nie będzie współczynników a, i a. Istotnie wzór dla pierw- 
szego z tych współczynników można przekształcić, biorąc pod 


uwagę, że Su = nu iZv= nb: 
? 


non? — Yuľuv ` noZlu —v(Żu)? +o(lu)? + Zulu - 
a, = == — S = 
1 niw — (Qu)? nZu? — (u)? 


v (du)? — Zuiw kd i Zu (v £u — Xuv) 
nZzu? — (Lu? "niu — (Au) 


nu (v Zu — Xuv) — u(n Xuv - Pa - rw Lu) 


— s = 
n Xu — (2u) ngu? — (Zu) 


-n%uv— Zużu — — 
= v— bu 


RZ YU? — (Zu) h 


W ten sposób pierwsze równanie regresji przybiera prostszą 
formę z jednym tylko współczynnikiem b,: 


Y=v+b, (Gu), S BYS 


Podobnie drugie równanie otrzyma formę: 


X =u +b, (y—v) 
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Wzory na współczynniki b, i b, można także przekształcić, na- 
dając im wygodniejszą do obliczeń formę. A więc dla pierw- 
szego z nich będziemy mieli: 


_n(Zuvy— Żużv) . nZuv — nu Yv = 
| „RZU” — (Zu) M MAE: z=2(Z U) | (UM ;: 


n2 (uy — uv) Zvulu—u) - 
nZu? — ZnuZu + nu? Z u” —2uZu + nu 


Z v(u —u) iż Z v(u — u) 


= = ac] 
Zu —2Zuu+ Zu” Z (u — u)? 
Prowadząc dalej te przekształcenia, można otrzymać inną 
jeszcze formę powyższego wzoru. Mianowicie od licznika jego 
można odjąć sumę v% (u— u), którą jest równa zeru. Bę- 
. dziemy wtedy mieli: 
Z v(u — u) — v Z(u— u) _ By(u— u) — o(u— u) _ 


REŻ 
Z (u — u)? 


Podobnie dla drugiego współczynnika otrzymamy wzory: 


b —_ Zu —v) dj żu—u0(w—v) 
3 my W Z(v —v)? 


Współczynniki b, i by noszą nazwę współczynników 
regresji. 

Dla równań regresji formy (1) i (2) można dowieść, że bez 
względu na wartość spółczynników b, i b, suma dodatnich 
odchyleń wariantów u i zmiennej « od odnośnych wartości X 
jest równa sumie odchyleń ujemnych i tak samo suma dodat- 
nich odchyleń wariantów v zmiennej y od odnośnych war- 
tości Y jest równa sumie ujemnych. 
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Wyprowadzone w tym ustępie równania są zwykle pisańe 
inaczej. Mianowicie zamiast symboli wariantów u i v popula- 
lacyj pisze się symbole odnośnych zmiennych ewentualńych 
x i y. Pod pewnym względem jest to wygodniejsze, trzeba 
tylko pamiętać o tym, że sumowanie dotyczy nie wartości 
wariantów, lecz samych wariantów. Zamiast Średnich arytme- 
tycznych u i v dla wariantów bierze się przy tym średnie zmien- 


cza się symbolami x i y a nie x i y. Będziemy w ten sposób 
mieli równania formy następującej: 


Y=y+b(x — z), X =x -+b(y—y) 


p o Zylc—am) _ Sle ya 
t E E Zz(x—z2) 


zzy—y _ Z(%—zx)ly-y 
2 (y—y) Z (y—y) 
To ogólnie przyjęte znakowanie będziemy stosowali w dal- 
szym ciągu, mając zawsze na myśli powyższe zastrzeżenia. 
Zastosujmy powyższe wzory do realnych przykładów. 
Weźmiemy z początku dla większej przejrzystości materiały 
złożone tylko z dziesięciu wariantów. Poszczególne wartości 
zmiennych ewentualnych będą tu na ogół reprezentowane przez 
pojedyncze warianty. Weźmiemy mianowicie (tab. 39,1) ma- 
jowe Średnie temperatury powietrza z 10-letniego okresu 
1899 —1908 dla miejscowości: 


DoZ 


Kraków 50004 N 19°57'E 
Poznań 52026' 16%56' 
Kijów 50°27 30°30' 
Nerczinskij Zawod DICTO: 119°37' 
Swerdłowsk 56°50' 60938 
(Jekaterinburg) 

Tomsk  - 5630' 8458 


Tabela 39,1 
Średnie majowe temperatury. 
Nerczin: | Swer- 


Data każe Poznań | Kijów ze aldzj| Zawod | e | oo 
awod 


Tomsk 


1900 12.8 12.0 14.7 
1901 14.2 15.1 15.1 
1902 10.8 | 10.5 12.9 
1908 14.4 14.0 15.0 
1904 12.4 12.2 12.4 
1905 14.0 141 | 15.9 
1906 14.8 153 18.4 
1907 15.7 14.8 17.3 
1908 151 14.7 | 


Średnie | 1369 | 13.54 1512 | 910 | 10.10 | 

Zestawmy temperatury Krakowa z temperaturami pięciu 
innych miejscowości podanych w tabeli 39,1. Dla przykładu 
podam szczegółowe rachunki dla zestawienia Kraków — Ki- 
jów (tab. 39, 2). Temperatury Krakowa będziemy uważali ze 
zmienną x, temperatury Kijowa za y. 


Tabela 39,2 
Temperatury majowe Krakowa (x) i Kijowa (y). 


M m M 


= 


p 
VYN HM M a j 


1899 13.7 | 127 | 148 EEE 


Data | x | x— x | 6-2) | v | yy |ø -p e0 ww 


1899| 13.7| +0.01 | 0.0001| 14.8 82 | 0.1024| — 0.0082 
1900 | 123| —139 | 19321| 147 42 | 01764] + 05838 
1901 | 142 +0.51 | 0.2601] 15.1 0.0004| — 0.0102 
1902 | 10.3 —3.39 |11.4921| 129 22 | 49284| + 7.5258 
1903 | 14.4 +0.71 | 05041| 15.0 12 | 0.0144! — 00852 
` 1904! 124 —129 f 72 | 7.3984 + 35088 
1905| 140 +0.31 | 0. "78 | 0.6084, + 02418 
1906 | 148 +1.11 4 10.7584 +- 36408 
1907 | 15.7 +201 | 4. +218 | 47524] + 43818 
1908 | 15 1| +1.41 | 1. 1 |-042 | 0.1764] — 0.5922 


3% +6.07 P 2090] 151.2 | + 6.24 BRA -+ 19.8828 


Sumy | —6.07 — 6.24 | — 0.6908 


Zadania i metody statystyki 14 


210 § 39, 40- 


Na podstawie tej tabeli znajdujemy b, = 0.8269, b, = 0.6637. 
W podobny sposób można obliczyć współczynniki regresji dla 
pozostałych pięciu zestawień (tab. 39,3). 


Tabela 39,3 


Współczynniki regresji dla średnich majowych temperatur dla 
różnych miejscowości w stosunku do Krakowa. 


Miejscowości b, b, 


Poznań + 0.9300 + 0.9842 
Kijów + 0.8269 + 0 6637 
Nerczinskij Zawod +05781 -+ 0.5709 
Swerdłowsk —0.4270 —0 3109 
Tomsk -- 0.0520 + 0.0275 


40. Charakterystyki korelacji. Z przykładów poprzedniego 
ustępu wynika, że charakter korelacji może być bardzo różny. 
Możną wobec tego mówić o różnych jej stopniach i róż- 
nej ścisłości. Stopień korelacji podaje, o ile 
zmienia się — wzrasta lub zmniejsza się — 
zmienna Y skutkiem przyrostu zmiennej zx 
o jedność względnie oile zmienia się x, jeżeli 
zmienna y wzrasta o jedność. W jednym i w drugim 
wypadku miarą stopnia korelacji będą odnośne współczynniki 
regresji. Chcąc mieć jedną wspólną miarę trzeba wziąć średnią 
tych dwóch współczynników. Ponieważ te współczynniki są 
wielkościami różnego rodzaju, trzeba tu użyć średniej geome- 
trycznej. Otrzymamy w ten sposób jako miarę stopnia kore- 
lacji nową funkcję, która nosi nazwę współczynnika ko- 
relacji. 

Współczynnik korelacji jest zatem średnią 
geometryczną współczynników regresji. 


r = Vb, b, 
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Nadaje mu się znak taki, jaki mają współczynniki regresji. 
Dla przykładów poprzedniego ustępu będzie on miał wartości: 


Poznań + 0.932 
Kijów + 0.741 
Nerczinskij Zawod + 0.572 
Swerdłowsk — 0.364 
Tomsk + 0.0378 


Warto zaznajomić się bliżej z tą funkcją statystyczną. 
Wstawiając do równania T= V b, b, wzory współczynników 
regresji z poprzedniego ustępu, otrzymamy równanie: 


Z (ż—2) (y—y) 


PRE x = 
V 2(1—ax)2 (y—y)2 


Ponieważ 2 (x1— c)? no aa 2(U — y)? =n 0y, gdzie 
Gr 1 Gy są to średnie odchylenia zmiennych x i y, otrzymu- 
jemy wzór: 
r= 2 @— a) (y—y)_ 
NOx Oy 
który może służyć do obliczenia omawianego współczynnika. 
Następnie można zrobić jeszcze jedno przekształcenie: 


p EA x061 
R Sy 


n 


Mamy teraz w równaniu znane już nam współrzędne nor- 
malne: 


Ten ostatni wzór dowodzi, że współczynnik korelacji jest 
pewnego rodzaju momentem drugiego rodzaju, podobnie jak 
wskaźnik skłonności drugiego rodzaju i wskaźnik skupienia 
"wariantów (por. ust. 19 i 20). Wyróżnia się on od wszystkich 
momentów, z jakimi mieliśmy dotychczas do czynienia tym, 
że figurują w nim dwie zmienne: jest to moment mie- 
szany. 

Za pomocą współczynnika korelacji można wyprowadzić 
dla współczynników regresji nowe wzory, które mogą być uży- 
teczne: 


ls ry Brat: 
Ox & Oy 
Jak to już było wspomniane, współczynnik korelacji uważa 
się za dodatni, jeżeli współczynniki regresji są- dodatnie, za 
ujemny w przeciwnym. razie. Jego wartość absolutna jest za- 
warta w granicach od 0 do 1. W ust. 29 przykłady zostały 
dobrane umyślnie dla zobrazowania tych różnie. Można 
dowieść, że współczynnik korelacji nie może być większy od 
jedności. Dowód jest zawiły, dlatego też nie podaje się. Czy- 
telnik znajdzie go w podręczniku Andersona (str. 275—6). 
Przechodzimy teraz do określenia ścisłości kore- 
lacji. Chodzi tu o wielkość odchyleń wariantów zmiennej y 
od odnośnych wartości Y, wżzględnie o podobne odchylenia 
x od X. Ponieważ te odchylenia są różne, trzeba wziąć ich 
Średnią. Najbardziej poglądowa byłaby Średnia arytmetyczna 
ich wartości absolutnych, czyli osobliwego rodzaju odchyle- 
nie przeciętne, ale na to nie można wyprowadzić ogólnego 
wzoru. Trzeba wobec tego wziąć pewnego rodzaju odchylenie 
średnie — pierwiastek kwadratowy z sumy kwadratów tych 
odchyleń podzielonej przez ich' liczbę: 


S (4 — Y} 
e (y X) względnie 


n 
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Dla tych wielkości nie trudno jest wyprowadzić wzór ogólny. 
A więc dla pierwszej z nich będziemy mieli: Y = y + b, (x — z) 
i wobec tego 


i ZU 
S 


n 


Tab atana E 


n 


Ze TDU FeLi 
Z (x — x)? n 
EAE DARS ERA 


Ponieważ zaś według przytoczonego poprzednio wzoru 


1 


G 
b! = a r „otrzymamy ostatecznie: 
e 


/.ZW=TN 


n 


Podobnie wypadnie: 


/ Z (c— X)? y iani, 
4 GEE TJ T p A: 1—r 
n 


Dla oceny tych średnich odchyleń trzeba je porównać 
z wielkością wariantów. W tym celu trzeba je podzielić przez 
odnośne średnie. Otrzymamy w ten sposób wielkości: 


wsp PO RZ WERE 
= WEZ y 1—r* 
y c 


analogicznie do wskaźnika zmienności. 
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Dla charaktetystyki korelacji trzeba mieć jedną taką wiel- 
kość wspólną dla obu populacyj. Podobnie jak przy współ- 
czynniku korelacji trzeba będzie wziąć średnią geometryczną: 


© vis 


Otrzymana wielkość będzie charakteryzowała wymiar 
omawianych odchyleń. Jest ona zawsze mniejsza od jedności 
i tym większa im ścisłość korelacji jest mniejsza. Wobec tego 
dla charakteryzacji ścisłości korelacji lepiej jest wziąć dopeł- 
nienie do jedności: 


=i y pra a >) 


Tẹ wielkość można nazwać kE GR Śścisło- 
ści korelacji. Wskaźnik ten jest mniejszy od jedności. 
Tylko przy r=1 dochodzi oh do tej granicy. Ścisłość kore- 
lacji jest wtedy największa i każdej wartości x odpowiada 
jedna tylko wartość y i odwrotnie. 

Przykłady na wskaźnik Ścisłości korelacji będą podane 
w następnych ustępach, bo dla przytoczonych powyżej mate- 
riałów klimatologicznych obliczyć go nie można, chyba że się 
wprowadzi temperatury absolutne. 


41. Wiarogodność charakterystyk korelacji, Tak samo jak 
dla wszystkich innych charakterystyk, trzeba teraz rozpatrzyć 
wiarogodność charakterystyk korelacji. Trzeba zobaczyć, w ja- 
kim stopniu wartości tych charakterystyk otrzymane z prób 
różnią się od odnośnych wartości dla całości populacji. Trzeba 
wziąć, tak jak w ust. 28, wszystkie możliwe próby z porówny- 
wanych populacyj i dla każdej pary prób obliczyć wartości 
charakterystyk korelacji. Otrzymamy w ten sposób wtórne po- 
pulacje, które dadzą możność rozwiązania postawionego w ten 
sposób zadania. Jest ono bardzo trudne i dlatego osraniczymy 
się do konkretnego przykładu. 


= 
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Weźmiemy mianowicie 90 par danych, z których pierwsza 
jest liczbą promieni w szczytowych baldachach olszewnika 
(Selinum carvifolia), druga zaś liczbą promieni w pierwszym 
bocznym baldachu tejże rośliny (tab 41,1). Widzimy od razu, 
że baldachy szczytowe mają na ogół więcej promieni niż 
boczne. Liczby dla szczytowych baldachów będziemy uważali 
za warianty zmiennej ewentualnej z, liczby dla bocznych — 
za warianty zmiennej y. 

Obliczmy dla tych dwóch populacyj jeden ze współczyn- 
ników regresji oraz współczynnik korelacji. Wypadnie: 


b, = + 0.4321, r = + 0.679. 


a 
Tabela 41,1 


Liczby promieni w szczytowych i pierwszych bocznych bal- 
dachach olszewnika. 


31.38 027 0820 24 7525 26 28: 29 
23. R29'0,29: 52050297 0429 21 27 21 


40 41 34 24 34. 30 32 33 29 
ZE V Zd: 4426011220. 42851 25 29 25 24 


30 40 33 29 28 25 24 
24  2ł..,90 18 22 16, 18 


26 40 25 29 27 26 
24 28 21 25 26 22 


36 24 31 31 32 29 
23 19 29 26 26. 29 


33 29 25 26 34 25 
25 26 23 21 28 23 


27 38 Z G22 399 R2942-20.-128 
24 25 23 (25 30 25 24 26 


38 (88 37 29 28 29 28 26 26 
30. 30828 0,23. -.122../-20.,22: 20. ,26 


PA E ETTE A 28:27 - „29y 55,80 GSZBŁ- „Zd 
26 „.Z8ERZY 020 0230: 423, 21 5,20) 20. (23 


Weźmiemy następnie z omawianego materiału 9 prób po 
10 par wariantów według tabeli 41,1 i zobaczymy, jakie war- 
tości wypadną dla tych samych współczynników. Wartości b;, 
i r są zestawione W tabeli 41, 2. Są to częściowe populacje 
wtórne tych charakterystyk korelacji. 


Tabela 41,2 


Baldachy szczytowe i boczne olszewnika. 
Pr óby b, r 


0.3926 0.432 
0.1572 0.404 
0.7007 0.744 
0 5044 0.728 
0.4776 0 602 
0.4252 0.648 
0 3908 0.834 
0.6278 0.837 
0.2898 0.519 
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Średnie 0.4407 0.639 


a A O 


Wypadły one różnie dla różnych prób i odmiennie dla prób 
niż dla całości materiału. Średnie arytmetyczne wartości dla 
prób zbliżają się natomiast do wartości odnośnych charakte- 
rystyk dla całości materiału. Zupełnego wyrównania nie 


Se let reno 
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można się spodziewać nawet wtedy, gdyby się wzięło wszyst- 
kie możliwe próby. Mielibyśmy wtedy wprawdzie pełne popu- 
lacje wtórne, ale jak to było wyjaśnione w ust. 29, tylko po- 
pulacje wtórne złożone ze średnich dają Średnią równą war- 
tości charakterystyki dla populacji. 

Zbadanie pełnych populacyj wtórnych dla charakterystyk 
korelacji prowadzi do określenia wymiaru średnich błędów 
dla tych charakterystyk. Otrzymuje się wzory: 


+1 — r? mer 
Gy pn "2 Vni 

Dla podanych powyżej populacyj dla olszewniką mamy 
0x = 4.465, oy = 2.840 i wobec tego wypada e(b,)=0.1651, 
e (r) = 0.245. 

Co do wzorów na średni błąd współczynników regresji i ko- 
relacji trzeba zrobić to samo zastrzeżenie, jakie było obszernie 
omówione odnośnie podobnych wzorów dla charakterystyk po- 
jedynczych populacyj w ust. 30. Mianowicie jako tako dokładne 
wartości otrzymuje się z nich tylko przy dużej liczbie warian- 
tów. Przy małej ich liczbie trzeba obliczać, tak jak dla śred- 
niej arytmetycznej, prawdopodobieństwo gorszych — bardziej 
odbiegających od prawdziwej — wartości niż ta, którą się 
otrzymało dla danej próby (por. ust. 31). Wykonanie takich 
obliczeń znajdzie czytelnik w podręcznikach Fishera i Ro- 
manowskiego. 


£ (b.) CH 


+ EGER 


Trzeba dodać jeszcze jedno zastrzeżenie: podane wzory 
dla błędów charakterystyk korelacji zostały wyprowadzone 
w założeniu, że rozpatrywane populacje mają formę normalną. 
Ponieważ tak na ogół nie jest, wynikają z tego dalsze odchy- 
lenia wartości obliczonych od prawdziwych. 

Można naturalnie postawić zagadnienie wiarogodności 
wskaźnika ścisłości korelacji. Wobec zawiłości tego zagadnie- 
nia nie będę go rozpatrywał. Ograniczę się do podania war- 
tości wspomnianego wskaźnika dla materiału olszewnika. Dla 
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niego mamy: x= 4.465, oy— 2.840, x1— 29.47, y= 24.28, 
r=0.679. Wobec tego wypada w = 0.902. 


42. Tabele korelacyjne. Przy dużych populacjach trzeba 
dla uproszczenia obliczeń układać dane w tabele korela- 
cyjne, albowiem wtedy te same pary wartości x i y wystę- 
pują wielokrotnie. W tym celu rysuje się szachownicę i wypi- 
suje się u góry pionowych rzędów wartości x a na początku 
poziomych wartości y. Następnie na skrzyżowaniu jednych 
i drugich wpisuje się częstości odnośnych par wartości x i y. 
Wreszcie u dołu pionowych rzędów umieszcza się częstości 
wartości zmiennej x, a na końcu poziomych rzędów częstości 
wartośei zmiennej y. 

Jako przykład podam: 1) liczby dzieci u matki i córki 
według danych Pearsona, Lee i Moore'a, 2) wiek męża 
i żony według angielskiego spisu ludności z r. 1901, 3) liczby 
kwiatów języczkowych i rurkowych w szczytowych koszykach 
arniki według badań własnych nad materiałem z Łojowej 
w okolicach Delatyna i 4) średnie zachmurzenie i dobowe am- 
plitudy temperatury powietrza w Batawii na Jawie z lat 
1908 — 1917. Pomijam natomiast klasyczny przykład kore- 
lacji między wzrostem syna i ojca, przytaczany nieomal we 
wszystkich podręcznikach, gdyż odnośne materiały angielskie 
są wadliwe z powodu niewłaściwego wytknięcia granie klas, 
przez co częstóści wypadły częściowo ułamkowe. - 

Dla obliczenia charakterystyk korelacji z takich tablic 
metodą najmniejszych kwadratów używa się tych samych 
wzorów, jakie poprzednio stosowaliśmy do małych materia- 
łów, a więc: 


Z (1—2) (y—Y) 
Z (x — x)? 


b, — 


2(c—23(y—y) 
2 (y—y) 
a? 


b= 


Tabela 42,1 


Korelacja między liczbą dzieci u matki i u jednej z jej córek 
w małżeństwach trwających conajmniej 15 lat według angielskiej statystyki. 
mma nh A RA R AW CI OAK ZOO PA AA AA DA A |OD „MK. ZTM A O O A ZZO S 
Liczba dzieci Liczba dzieci u matki 
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Tabela 42,2 


Korelacja między wiekiem żony i męża według angielskiego spisu ludności z r. 1901. 
Częstości oznaczają tysiące par. 
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Tabela 42,3 
Korelacja między liczbą kwiatów języczkowych irurkowych w szczytowych koszykach arniki 
z okolic Łojowej. 


Liczby kwiatów | _Liczby kwiatów języczkowych (x) 


—| Ogółem 


rurkowych |10 | 11 | 12 | 18 | 14 | 16 | 16 18 | 19 | 20 | 21 | 22 | 23 
43— 
48 
53— 
58— 
63— 
68— 
13— 
48— 
83— 
88— 
93— 
98— 
103— 
108— 
118-- 
118— 
128—= 
128 `- 
133 — 
138— 
143 — 
148— 
153— 
158— 
163— 
168 - 
113— 
178— 
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Tabela 42,4 


Korelacja między średnim zachmurzeniem a dzienną amplitudą temperatury powietrza 
w Batawii w miesiącach czerwiec — sierpień 1908 — 1917 lat. 


s EEEE coć 
BA Średnie zachmurzenie w setnych (x) 

temperatury | I Szy NF 1 - i i Ogółem 
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3.5— 
4.0— 
4.5 - 
5.0— 
5.5 — 
6.0— 
6.5— 
7.0— 
7.5— 
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8.5 - 
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9.5— 
0.0— 
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Przede wszystkim trzeba obliczyć sumę 2 (c — z) (y —y). 
W tym celu trzeba uciec się do metody wartości wyjściowej. 
Nietrudno jest wyprowadzić odnośny wzór. Przyjmujemy dla 
zmiennej x wartość wyjściową a, , dla zmiennej y — war- 
tość a. Będziemy mieli: 


Z (1 — a,) (Y — a). = Z(c—zr+ 1 —a,) (y —y + y — a) = 


=2 (@— x) (y — y) + Z (c—2) (y — a) + Z (£ — a) (Y — y) + 
+ Z (x — a) (y — a) =Z (x — 2) (y — y) + (y — a) Z (c— 2) + 
+ (x — a,) Z (y — y) + n (x —a,) (y — az). 

Ponieważ sumy 2 (x —2) i Z (y szaj) jako sumy algebraiczne 
odchyleń od średniej są równe zeru, drugi i trzeci wyraz zni- 
kają. Otrzymujemy zatem: 

Z (c — 2) (y — y) = Z (x —a,) (y — a) — n {x — a,) (y — a) . 
2 (x -— a) 


n 


Ale z drugiej strony T == a; 


2 (Y — 02) 

n 
Wobec tego będziemy mieli ostateczny wzór: 
2 (x — a,) Z (y — a>). 
PNE: E, ek 
Sumowanie dotyczy naturalnie wszystkich par wariantów obu 
zmiennych. 

Pozostaje jeszcze obliczyć sumy Biadh iei od 
średniej. Jest to zadanie już nam znane, równoważne z obli- 
czaniem średniego odchylenia. Dla zmiennej x mamy na to. 
wzór: 


y= üy pE 


Se 1) (y—y)= 2 (1—a,) (y— a) 


= [Z (x —a,)]* 
2 (x — x) = 2 (x — a)? — PB s. JI” 
i podobny wzór dla drugiej zmiennej: 


— [2 (y — az)]* 
(y—y)"= (y— az) — Rabe 
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W praktycznym wykonaniu porządek obliczeń jest od- 
wrotny. Pokażę go na przykładzie liczb dzieci u matki i córki 
(tab. 42,1). Obliczenie sum kwadratów odchyleń, zestawione 
w tabelach 42,5 — 6 nie wymaga żadnych wyjaśnień. 


Przyjmujemy a, =5, a= 4. Otrzymujemy % (x — a) = + 398, 
Z (y — a) = + 335 oraz Z (x — a)? = 8814, Z (y — a)? = 8919. 


Stąd 2 (x — 1)? = 8814 — 1000 = 8814 — 806 = 8008 


3357 


Z (y — y)? = 8919 — *1000 = 8919 — 112=8807 


Tabela 42,5 


8 


c—a f(c—a) f(c—a)* 


SZYI 848 

— 3 513 

— 2 400 

—1 132 
A EDE 


l. 124 
"FZ 452 
+8 
+ 4 
+5 
+ 6 
+7 
+8 
+9 
t10 
SoN Bi 


1 
2 
3 
4 
5 
6 
7 
8 
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| Tabela 42,6 - pra 
fy — dy) 
440 
294 
194 | 
105 ' 
0 | — 1033 | 
|) syag | 
206 | 
219 | 
292, 
170 
144 
56 
' 104 
54 


i- eT o r- a W D m O (8: 


M M m M 
W DD M © 


1000 + 1368 8919 


jTeraz przychodzi z kolei bardziej zawiłę obliczenie sumy 


2 (aż że p) (y—y). W tym celu piszemy na nowo tabelę kore- 
lacyjną pozostawiając w niej wolne rzędy, odpowiadające war- 
tościom wyjściowym (tab. 42,7), przez co tabela zostaje podzie- 
lona na cztery „kwadraty”. Następnie u góry piszemy odchy- 
lenia zmiennej x od wartości wyjściowej a,, z lewej zaś strony 
takie same odchylenia y od a, i wreszcie w każdej kratce pi- 
szemy u góry z lewej strony odnośne częstości. Po tych wstęp- 
nych czynnościach przystępujemy do obliczeń. W każdej kratce 
u dołu z prawej strony piszemy iloczyn częstości przez odchy- 
lenie y—a,. Te iloczyny sumujemy osobno dla każdego kwa- 
dratu i wpisujemy sumy w: wolnym poziomym rzędzie. Sumy 
będą dodatnie w dolnych kwadratach, ujęmhe — w górnych, 
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TO TEENAA VAEN EEDE ZETTRZY ORO AEC OE ZOK RET OZYCA 


+9 |+ 10 |+ 11 


I 


11 13 
10 11 EE. 10 4! 
— 79| — 79 —122 —158 —143| — 90| — 76 — 47 | 

-- 34| + 52 -+ 96, +161 +162| -+168 +154 --131| + 96 


T 56 | 12 
7, 6 | | 


Tabela 42,8 


Liczba dzieci u matki i córki. 


R 
| 
s 


(+) (7) 


34 
52 
26 


BLN 


MOOWOJOOTR WIO MO P-MWR | 


+ 
-— 
-- 
pa 
-- 
-+ 
+ 
== 
-+ 
H 
+ 


M M 


+ 2089 


Otrzymane wyniki zbieramy w osobną tabelę 42,8. A mia- 
nowicie piszemy w pierwszej kolumnie odchylenia 1—a;, 
w osobnych kolumnach (drugiej i trzeciej) sumy dodatnie 
i ujemne iloczynów z poprzedniej tabeli. W następnej kolum- 
nie (czwartej) umieszczamy sumy algebraiczne tych sum 
osobno dla każdego odchylenia x —a,. Następnie mnożymy 
te ostatnie sumy przez wspomniane odchylenia, a iloczyny 
w ten sposób otrzymane piszemy w ostatniej kolumnie. Wresz- 
cie sumujemy te iloczyny, uważając na znaki — dodawanie 
ma być algebraiczne! Otrzymujemy w ten sposób: 


2 (x —a,) (y—a,) = + 2089 


228 


W końcu odejmujemy poprawkę: 


Z (x —a,) Z(Y—a; 898 X 335 
> (x — y TEA a "> E 
p 1009 i 
co daje ostatecznie Z (x — x) (y — y) = 2089 — 301 — 1788. 
Na podstawie otrzymanych w ten sposób wyników wy- 
pada ostatecznie: 


1788 1788 
=  =HROQ. ą = = 
1” 8008 1 0.2288, ba 8807 


Równania regrekji będą miały formę: 


| Y = 4.33 + 0.2233 (z — 5.90) 
' X= 5.90 + 0.2030 (y — 4.33) 


Dla obliczenia średnich błędów będą jeszcze potrzebne 
wartości średnich odchyleń oz i oy, Wynoszą one w naszym 
przypadku 0x==2.830, oy = 2.968. Wobec tego e (b,) = 0.0324, 
e (bs) == 0.095, e (r) = 0.0302. 

Wreszcie wskaźnik ścisłości korelacji jest równy w = 0.440. 

Mamy w tym przypadku niewielką wartość współczynnika 
korelacji i mierną jej śŚcisłość. 

Pozostałe przykłady potraktuję mniej szczegółowo, pozo- 
stawiając czytelnikowi trud wykonania obliczeń. A więc przy- 
kład drugi, dotyczący korelacji między wiekiem żony i męża, 
różni się od poprzedniego tym, że warianty są zgrupowane. 
Niewielka z tego wynika komplikacja, gdyż szerokość kias 
jest dla obu zmiennych jednakowa. mianowicie 5. Operując 
numerami klas, jak wartościami zmiennych ewentualnych. 
otrzymujemy wartości: 


= + 0.2030, r = + 0.2129. 


Z(x —x)* = 34347, (y —y')?==36497. 
Trzeba od nich odjąć poprawkę Shepparda w wysokości 


określonej wzorem a wypadnie wtedy: 


5 (x — x) = 33904, (y —y)? = 36054. 


Następnie suma Z (u —x) (y —y) będzie równa 32374. 
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Wobec tego, że szerokość klas jest jednakowa dla obu 
zmiennych, możemy otrzymane wartości użyć bez zmian do 
dalszych obliczeń, tak jak gdyby x =x, y =y otrzymamy: 

957 

LEa = 0.9550, by = ad - = 0.8980, r==0.926, 

e (b,) = 0.0053, e (b) = 0.0050, e (r) = 0.052, w = 0.888. 
Równania regresji będą Y = 42.31 + 0.955 (x — 40.06) 

X = 40.06 + 0.898 (y — 42.31). 

Mamy tu w przeciwieństwie do pierwszego przykładu wy- 
sokie wartości współczynnika korelacji i wskaźnika ścisłości. 

Większe komplikacje będą w trzecim przykładzie, doty- 
czącym liczb kwiatów rurkowych i języczkowych w szczyto- 
wych koszykach arniki (tab. 42,3), gdyż liczby kwiatów rur- 
kowych są zgrupowane, liczby zaś kwiatów języczkowych nie- 
zgrupowane. Szerokość klas dla kwiatów rurkowych jest 5. 
Oglądając tabelę korelacyjną, czytelnik zapewne zdziwi się, 
dlaczego zakresy klas nie są wytknięte przez liczby wielo- 
krotne 5. Otóż zostały one ustalone w ten sposób, żeby wartości 
środkowe wypadły wielokrotne 5. 

Dla liczby kwiatów języczkowych (zmienna x) otrzymu- 
jemy Æ (x—ux)*= 7009. Operując numerami klas dla liczby 
kwiatów rurkowych (zmienna y), będziemy mieli Z (y—y')* = 
= 16365, a po zastosowaniu poprawki Shepparda w wy- 


miarze —19=—15 otrzymamy 16290. Suma (y — y)? bę- 


dzie 25 razy większa. 

Przy obliczaniu sumy £(x—ax)(y—y) będziemy dla 
zmiennej y operowali numerami klas. Otrzymamy £ (£— z) 
(y —y) = 6388. Suma 2 (1 — x) (y—y) będzie 5 razy większa. 

Stąd otrzymamy: i 


6388 X 5 | 6388X 5 | a 
b= ggg = 4555 ba = gogg x gg ~ 00784, rz 0.598 


Równania regresji będą: Y = 115.1 + 4.557 (x — 18.78) 
#. X = 18.73 + 0.0784 (y — 115.1). 
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"Nadto mając ciągle na uwadze grupowanie zmiennej y, bę- 
«dziemy mieli średnie błędy e(b,) = 0.218, e (b,) = 0.0033, 
e(r)=0.021 i wskaźnik ścisłości korelacji w = 0.863. 

Wreszcie w ostatnim przykładzie, dotyczącym zachmurze- 
nia i dobowej amplitudy temperatury powietrza, mamy obie 
zmienne zgrupowane, ale o różnej szerokości klas: wynosi ona 
dla zachmurzenia 0.05, dla amplitudy temperatury 0.5 czyli 
10 razy więcej. 

Dla zachmurzenia (zmienna x) otrzymujemy Z(x1—x)= 
= 15878, po zastosowaniu poprawki Shepparda 15801. Dla 
otrzymania sumy Z (x— x)? trzeba tę liczbę pomnożyć przez 
kwadrat szerokości klas, to znaczy przez 0.0025. 

Dla amplitud temperatury (zmienna y) będziemy mieli 
Š (y'— y')? = 6322, a po zastosowaniu poprawki Sheppar- 
da 6245. Dla otrzymania sumy 2(y—y)? trzeba pomnożyć 
przez 0.5? = 0.25. 

Suma 3 (x'— x’) (y'—y') wypada ujemna równa. — 6780. 


Dla otrzymania 2 (z — x) (y—y) trzeba tę liczbę pomnożyć 
przez 0.05 X 0.5 = 0.025. 
Współczynniki będą miały wartości: 


6780 X 0.025 
— 15801 0.0025 777 


6780 X 0.025 
BE RR DABO T 0 


r=—0.629. 


Równania regresji będą: Y = 7.251 — 4.291 (x — 0.515) 
X = 0.515 — 0.1086 (y — 7.251) 


pit 


Wreszcie będziemy mieli średnie błędy e(b,)= 0.1614. 
e (b4) = 0.0041, e(r)=0.020 i wskaźnik ścisłości korelacji 
` æ = 0.792. 


ROZDZIAŁ VIII. 


KONTYNGENCJA. 


43. Pojęcie kontyngencj. Kontyngencją nazywa 
się współzależność między populacjami, z któ- 
rych jedna przynajmniej ma charakter jako- 
ściowy. 

Jeżeli populacja ma charakter jakościowy, :to jej warianty 
dają się podzielić na dwie grupy na podstawie posiadania 
względnie braku takiej czy innej cechy. Na przykład o ile cho- 
dzi o barwę włosów i oczu, taką cechą będzie występowanie 
bkarwika. W ten sposób włosy czarńe, szatyniaste i rude będą 
miały tę cechę, włosy zaś blond są jej pozbawione. Z drugiej 
strony oczy piwne i czarne będą miały, niebieskie zaś szare 
i zielone są jej pozbawione. Występowanie danej cechy ozna- 
czamy jakąś literą, powiedzmy A, brak jej natomiast taką 
samą literą ale małą, a więc a. 

Rozpatrzmy teraz dwie populacje jakościowe, pozostające 
ze sobą w związku z jakiejkolwiek przyczyny, na przykład 
wspomniane powyżej barwy włosów i oczu u tych samych 
osób. Oznaczamy występowanie cechy pierwszej populacji 
przez A, cechy drugiej przez B, nadto brak pierwszej z tych 
cech przez a, brak drugiej przez b. Otóż ogólnie można się 
spodziewać, że część wariantów A będzie miała cechę drugiej 
populacji, część zaś będzie jej pozbawiona i to samo można 
przypuszczać o wariantach a. Wobec tego można będzie jedną 
i drugą populację podzielić na cztery części. Warianty pierw- 
szej części będą miały cechy i pierwszej, i drugiej populacji, 
„oznaczymy je AB. Warianty drugiej będą miały tylko cechę 
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pierwszej, oznaczymy je przez Ab. Trzecia część wariantów 
będzie miała cechę tylko drugiej populacji, będą to warianty 
aB. Ostatnia wreszcie będzie pozbawiona cech obu populacyj, 
będą to warianty ab. Liczebność tych grup wariantów można 
zestawić w tabelę podobną do tabeli korelacyjnej ale złożona 
tylko z czterech kratek (tab. 43,1). Te liczebności oznaczymy 
symbolami wariantów ujętymi w nawias. 


Tabela 43,1 


Cechy | -© Ogółem 


(aB) | (AB) + (aB) 


(Ab) | (ab) (Ab) + (ab) 


LER EEE IRT NŚ 
(AB) + (Ab)| (aB)-+ (aB) | * T (aB (ab) 


Ogółem 


| 
3 
| 


Jako konkretny przykład weźmiemy współzależność mię- 
dzy barwą włosów i oczu według badań Ammona w Badenii 
(tab. 43,2). Nazwijmy. ciemnymi włosy i oczy posiadające wy- 
raźny barwik, jasnymi nie mające go. 


Tabela 43,2 


Włosy 


Oczy 


TĘ 6 iemne Jasne 


Ciemne 


| 
| 

Jasne | 32% 
| 


i | 
gae | 115 
| 2714 
| 


Ogółem 3971 2829 
Tego rodzaju tabele służą za podstawę do oceny charak- 
teru kontyngencji, jeżeli jedna z populacyj ma charakter iloś- 


ciowy, mają one inną formę — składają się z dwóch szeregów 


CE, 44 233 


kratek. Na przykład Pearson ogłosił następujące dane doty- 
czące związku między wiekiem dzieci a anemią (tab. 43,3). 


Tabela 43,3 


Wirek d Ape ci 
Barwa krwi | TERE Ogółem 
Fae 10 | 11 | 12 | 13 


| 
Naturalna | 3253124035 | 
Blada | 17 19 21 y Sb ERC GT: 135 


Ogółem | 51 | 46 | 50 | 51 | 52 | 56 | 58 | 364 


Trzeba jeszcze dodać, że każdą populację ilościową można 
potraktować jako jakościową. Można bowiem warianty więk- 
sze od pewnej granicznej wartości uważać jako posiadające 
pewną cechę a mniejsze jako nie mające jej. Taki podział jest 
stosowany na przykład w antropologii, kiedy się wyróżnia 
osobniki długogłowe od krótkogłowych. 

W następnym ustępie zajmiemy się określeniem charak- 
teru kontyngencji. Ograniczymy się do.najprostszego przy- 
padku, kiedy są porównywane dwie populacje, obie jakościowe. 


44, Współczynnik kontyrgencji. Badanie kontyngencji ma 
zupełnie inny charakter niż rozpatrzone w poprzednim roz- 
dziale badanie charakteru korelacji. Mianowicie dotyczy ono 
częstości wariantów, podczas gdy tam chodziło o ich wartości. 
To też nie można tu mówić o stopniu ścisłości, tylko ogólnie 
o charakterze kontyngencji. 

Jak zawsze w statystyce, chodzi i w tym przypadku o uję- 
cie liczbowe. Trzeba ustalić jakiś współczynnik kontyn- 
gencji, któryby określał charakter tego rodzaju współzależ- 
ności między populacjami. Taki współczynnik powinien przede 
wszystkim czynić zadość warunkowi, aby się równał zeru, 
skoro między cechami rozpatrywanych populacyj niema żad- 
nego związku, to znaczy jeżeli częstość względna A będzie taka 
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sama dla wariantów mających i niemających cechy B i od- 
wrotnie. Korzystając z oznaczeń tabeli 43,1 poprzedniego ustę- 
pu, można ten warunek zapisać w formie proporcji: 


(AB) (Ab) (AB) (aB) 


(aB) P (ab) * a (Ab) _ (ab) 


Stąd wynika, że wzór na współczynnik kontyngencji powi- 
nien zawierać czynnik (AB) (ab) — (Ab) (aB). 

Dalej ten współczynnik przybierać powinien wartość plus 
jeden przy najsilniejszym powiązaniu cech A i B. Najsilniejsze 
powiązanie będzie wtedy, jeżeli każdemu wariantowi A odpo- 
wiada wariant B i odwrotnie. Zajdzie to wtedy, kiedy (aB) = 
= (Ab) = 0. Wreszcie współczynnik kontyngencji powinien przy- 
bierać wartość minus jeden, jeżeli cechy A i B wyłączają się 
wzajemnie, to znaczy, jeżeli żadnemu wariantowi z cechą A 
"nie odpowiada wariant z cechą B i odwrotnie. Taki przypadek 
wystąpi, jeżeli (AB) =0. 

Powyższym trzem warunkom czyni zadość zaproponowany 
przez Yule'a współczynnik: 


__ (AB) (ab) — (Ab) (aB) 
a (Ab) (ab) + (Ab) (aB) 


Takie rozwiązanie zagadnienia nie jest jedyne. Propono- 
wano różne inne formy podobnego współczynnika. W szczegól- 
ności często można spotkać się z tzw. współczynnikiem 
korelacji dla cech niewymierzalnych, określo- 
nym przez wzór: 


PO ASERNE WAGO AO (OB)E EIT NY BARA 
[(AB) + (aB)] [(AB) + (Ab)] [(aB) + (ab)] [(Ab) + (ab)] 
Taka funkcja ma tyle wspólnego ze współczynnikiem ko- 
relacji, że da się wyprowadzić według prawideł obliczenia 
wspomnianego współczynnika, jeżeli się założy, że warianty 
A i B mają wartość jeden, a warianty a i b — wartość zero. 
Takie założenie oczywiście nie ma żadnego sensu. Powyższy 
„współczynnik korelacji ma ten sam licznik co współczynnik 


R= 
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kontyngencji o, a więc staje się równym zeru jednocześnie 
z nim. W innych przypadkach daje wartości odmienne, na przy- 
kład dla przytoczonego powyżej materiału statystycznego do- 
tyczącego barwy włosów i oczu wypada 0=0.689, R=0.201. 

Przytoczę jeszcze jeden przykład: skuteczność działania 
surowicy Behringa przy zastosowaniu jej do dzieci cho- 
rych na płonicę (dyfteryt). Fibiger ogłosił w tym względzie 
ciekawe dane z obserwacyj wykonanych w Kopenhadze 
(tab. 44,1). Wypada tu ọ = 0.591, R=0.160. Widzimy, że róż- 
nice pomiędzy obu funkcjami mającymi charakteryzować kon- 
tyngencje są ogromne. Ciekawy to przykład względności me- 
tod statystycznych. 


Tabela 44,1 


Współzależność między stosowaniem surowicy Behringa 
do dzieci chorych na płonicę a wyzdrowieniem. 


Wyzdro- RÓ ; 
| ia | Smierć | Ogółem 


Z surowicą 231 8 
Bez surowicy 215 


Ogółem 446 | 


Tabela A 


| 
Í 
| 
| 
t 
i 


| 
| 
| 
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Tabela B 


1 E 
2 

=== dx 
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Dziesięciotysięczne 


Tabela B (dokończenie) 


x 


Q= e J iz 


—Cco 


Dziesięciotysięczne 
4 


5160 
5557 
5948 
6331 
6700 


7054 
7389 
7704 
7995 
8264 


esoo0 
©O0-=JG 01 


8508 
8729 
8925 
9099 
9251 


1.0 
1.1 
1.2 
13 
1.4 


9382 
9495 
9591 
9671 
9738 


9793 
9338 
9874 
9904 
9927 


9945 
9958 
9968 
9977 
9984 


9997 


+0000 
+1187 
+2315 
+3330 
+4184 


+4841 
+5278 
+5486 
+5469 
+5245 


+4839 
+4290 
+3635 
+2918 
+2180 


+1457 
+0781 
+0176 
—0341 
—0760 


—1080 
—1302 
—1436 
—1492 
—1483 


—1424 
—1323 
—1.207 
—1073 
—0934 


—0798 
—0070 


+0120 
+1303 
+2422 
+3423 
+4259 


+4895 
+5309 
+5495 
+5456 
+5212 


+4790 
+4228 
+3566 
+2845 
+2106 


+1387 
+0717 
+0120 
—0387 
—0797 


—1106 
—13.20 
—143) 
—1494 
—1430 


—1416 
—1317 
—119Ł 
—1059 
—032) 


—0669 


—0051 


2 


+0239 
+1419 
+2529 
+3514 
+4332 


+4946 
+5338 
+5501 
+5440 
+5177 


+4740 
+4166 
+3495 
+2771 
+2033 


+1317 
+0654 
+0065 
—0433 
—0832 


—1132 
—1336 
—1453 
—1495 
—1475 


—1407 
—1305 
—L181 
—1045 
—0936 


Tabela C 


= — (a* + 30)9, 


dg, 
az 


* 


Dziesięcioty sięczne 


3 


4 


+0478 
+1648 
+2737 
+3693 
+4472 


+5043 
+5889 
+5506 
+5403 
+5102 


+4635 
+4038 
43354 
42623 
-+1887 


+1179 
+0529 
0012 
—0521 
—0900 


—1180 
—136) 
—1467 


—1496 
—1465 


—1389 
—1232 
—1154 - 
—10!7 
—0879 


—0359 


—0018 


2 


Tabela D 


| > (=t —6x2+-3) po 


Dziesięciotysięczne 


Ba ród opi WZA a e 


0.0 +11968 +11965 11956 +11941 +1 920 111894 11861 #11822 #11777 +11727 
0.1 +11671 +11609 +11541 
0.2 +10799 10682 -+. 0560 


+9413 
+7607 


+5501 
+ 3281 
+ 0937 
— 1247 
— 3203 


— 4839 
— 6091 
— 6925 
— 7341 
— 7364 


— 7043 
— 6441 
— 5632 
— 4692 
— 8698 


— 2700 
— 1765 
— 0927 
— 0214 
+ 0362 


-+ 0800 
-- 1105 
-+- 1293 
-- 1879 
-- 1385 


+ 1380 


+0218 


+ 9250 + 9082 
+7408 +7206 


+5279 + 5056 
+3000 + 2770 
+ 07.2 + 0487 
— 1454 — 1660 
—33838 — 3559 


— 4983 — 5122 
—6 93 — 6292 
— 6986 — 7042 
—7361 — 7376 
— 7847 — 7826 


— 6994 — 6942 
— 6368 — 6293 
— 5542 —5452 
— 4593 — 4494 
— 8592 — 3492 


— 2603 — 2506 
— 1676 — 1588 
— 0840 — 0774 
~ 0150 — 0088 
+0412 +0,61! 


+0836 +0871 
-+ 1129 + 1152 
+1306 + 1317 
+1883 + 1386 
+1382 +1378 


1281 1107 


+0165 +0123 


+11468 +11368 +11304 +11214 +11118 +11017 +10911 
+10484 +10302 +10165 +10024 + 9878 + 9727 +9572 
+8910 +8735 + 8556 +8378 +8186 +7996 +7808" 
+7001 -+ 6798 + 6583 -+ 6871 + 6.Ł6 +5940 +5721 


+4831 +4605 + 4378 +4150 + 3921 +8691 - 3461 

+2539 -+ 2309 +2078 + 1849 + 1620 + 1891 +1164. 
-- 0265 + 0043 —0 76 — 0394 — 06.1 + (825 —1087 > 
— 1862 — 2063 — 2260) = 2455 — 2646 — 2885 — 8021'* 
— 8731 — 8901 — 4066 — 4228 — 4387 — 4541 — '4692- 


— 5237 —5889 — 5516 — 5639 — 57/58. — 68438 — 598% 
=- 6886 — 6476 — 6E61 — 6642 — 6720 — 6192 - 6861 
— 7093 — 7141 — 7185 — 7224 — 7269 = 7292 — 4818 
— 7888 — 73895 — 7:99 — 7400 — 7286 — 7269 — 7578 
— 7301 — 7214 — 7248 — 7209 — 7172 — 7152 7088 


— 6888 — 6831 — 6772 —6710 — 6646 — 6:80 — 6511 
— 6216 — 6137 —6057 . 5975 — E891 —F6(6 — 5720 
— 5360 —5267 — 5173 — 5079 — 4963 — 4886 — 4789 
— 4895 —4295 —4 95 — 4095 — 5095 — 5694 —8798 
— 3392 — 3292 —3192 — 3098 — 2994 — 2695 — 2797 


— 2411 — 2316 — 2222 — 2129 — 2036 — 1945 — 1854 
— 1502 — 1416 ~ 1882 — 1249 — 1167 — 1086 — 1006 
— 0700 — 0626 — 0554 — 0488 — 0414 — 0346 — 0279 
— 0027 — 0033 + 0092 + 0148 + 0204 + (258 + 0811 
-+ 0508 +0554 +0598 + 0641 +0683 +0723 + 0762 


+ 0905 + 0937 + 0968 +0998 +1027 + 1054 + 1080 
+1173 +1194 + 1213 +1281 +1248 + 1204 + 1279 
+ 1828 + 1338 + 1847 +1855 +1863 +1869 +1375 
+ 1887 + '890 +1891 +1891 +1391 +1889 +1888 
+ 1874 + 1869 t 1364 +- 1858 +1351 +1845 +1837 


+0969 + 0829 + 0694 +0570 +0460 +0865 +0284 ` 


-+0090 -+0065 + 0047 +0033 + 0023 +0016 +0010 ` 


Ust. 32 - 
EEO Tabela E 


Funkcja S(t) Studenta (Metron Vol. 5 N3, 1925) 
Tysięczne 
na 3 4 5 6 7 8 9:80 11 


500 500 500 500 500 500 500 500 500 500 
532 535 537 537 538 538 538 539 539 539 
563 570 573 574 575 576 576 577 57 577 
598 604 608 610 612 613 614 614 614: 615 
621 636 642 645 647 . 648 650 650 651 651 


648 667 674 678 681 683 684 685 686 686 
672. 695. "705 -710 713. „745 + 746 717 „710. 239 
694 722 738 7389 742 745 747 748 749 750 
715. 746, 1799.:.766 1070, 03: 098 707 EENE 
733 768 783 790 795 799 801 803 804 305 


750 789 804 813 818 822 825 827 828 830 
765 807 824 , 834 839 843 846 848 850 851 
779 824 842 `852 858 862 865 868 870 871 
791 838 858 868 875 879 883 885 887 889 
803 854 872 883 890 894 898 900 902 904 


813 864 885 896 903 908 911 914 916 918 
822 87⁄5 896 908 915 920 923 926 ,928 930 
831 884 906 918 925 930 934 936 938 940 
839 893 915 927 934 939 943 945 947 949 
846 901 923 935 942 947 950 953 955 957 


852 908 930 942 949 954 957 960 962 963 
864 921 942 954 960 965 966 970 972 974 
874 931 952 963 969 973 976 978 980 981 
883 938 960 970 976 980 982 984 986 987 
891 946 966 976 981 984 987 988 990 991 


898 952 971 980 985 988 990 992 992 993 
904 957 975 984 988 991 992 994 995 995 
909 962 979 986 990 993 994 995 996 997 
914 965 982 989 992 994 996 996 997 998 
918 969: 984 990 994 996 997 997 998 998 


922 971 986 992 995 996 997 998 998 999 
926 974 988 993 996 997 998 998 999 999 
929 976 989 994 996 998 998 999 999 999 
932 978 990 995 997 998 999 999 999 1000 
935 980 991 996 998 998 999 999 1000 


937 981 996 998 999 999 1000 
940 982 997 998 999 999 1000 
942 984 997 998 999 1000 
944 985 998 999 999 1000 
946 986 998 999 999 1000 


947 987 998 999 1000 


> 


© 


= 


— 


w 


W 


o 


U 
.0 
1 
2 
3 
< 
.5 
6 
7 
8 
9 
-0 
1 
2 
3 
4 
„5 
6 
7 
8 
9 
2.0 
2 
8 
6 
8 
„0 
2 
4 
6 
8 
0 
2 
4 
6 
8 
0 
2 
+ 
6 
8 
0 
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Zadania i metody statystyki 


Tabela F (dokończenie) 
Funkcja S(t) Studenta (Metron Vol.5 N3, 1925) 


Tysięczne 


t n=12,135 14 15 16 


936 
947 
956 
963 


1.5 
1.6 
1.7 
1.8 
1.9 


970 
979 
986 
991 
994 


OZ 
0OOR l. O 


996 
998 
998 
999 
999 


oo Pio 


1000 
1000 1000 
1000 1000 
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